Autor: anne.guilde@free.fr Datum: To: guilde Betreff: Re: modification de pdf / comparaison de pdf
Le 30/08/2017 à 16:57, ALD a écrit : >
>
> Le mercredi 30 août 2017, 16:41:06 anne.guilde@??? a écrit :
>
>>
>> Pour Tesseract pas bien compris comment s'en servir avec un pdf
>>
>
> Forcément puisque ces logiciels vont faire de l'OCR sur une image (c'est bien
> ce que tu avais dit: le texte est sous forme d'image).
>
> Il faut donc leur donner une image à digérer, pas le pdf.
>
> Si je me souviens bien, les images dans les pdf sont au format jpeg.
>
> Je ne sais pas comment sont fait tes pdf, mais tu peux les ouvrir avec
> libreoffice draw et n'extraire que les images. il y a peut etre des
> utilitaires en ligne de commande aussi, mais je ne les connais pas.
>