Re: OCR...

Top Page

Reply to this message
Author: Haricophile
Date:  
To: guilde
Subject: Re: OCR...
Le lundi 30 septembre 2019 à 09:31 +0200, David Beniamine a écrit :
> Je réponds tardivement, mais si ça peut aider. Le jour ou j'ai
> découvert
> l'OCR, j'ai utilisé deux outils :
>
> + [pdfsandwich](http://www.tobias-elze.de/pdfsandwich/index.html) CLI
> mais simple à utiliser. Lit un pdf, fait l'OCR et écrit la sortie dans
> le pdf, fonctionne super bien, basé sur tesseract. Utilisé pour mettre
> de l'OCR sur mes vieux scans


Ah, jamais utilisé, mais c'est plus simple que d'autres méthodes.


> + [gscan2pdf](https://sourceforge.net/projects/gscan2pdf/) outil
> graphique pour scanner des fichiers, permet d'ajouter des posts
> traitements (dont OCR), trés efficace je ne scan plus qu'avec ça.


Ça par contre ça fait un moment que j'utilise ça.

N'empêche que sous Linux, il y des points faibles :

1. La mise en page.
2. La capacité a corriger automatiquement des images variées au moment
du scan, dont la géométrie quand on utilise un (mauvais) objectif de
smartphone comme scaner.
3. La qualité des dictionnaires pour la correction des mots.

... et j'attend toujours le scan a haute vitesse comme sur Youtube...

Le positif c'est qu'on peut encore faire des PDF et de l'OCR sans passer
par un serveur qui ne vous appartient pas (le «Cloud»).