Swisslinux.org

jean@adimp.ch · 05 Jan 2010 10:41:26

Salut,
J'ai un pdf créé à partir d'un scan. Est-ce que quelqu'un sait si le système OCR de google pour transformer une image en html est disponible en open source?

Meilleures salutations.

Solution : http://code.google.com/p/tesseract-ocr/downloads/list

PS : merci de votre patiente, c'est en posant la question que j'ai trouvé la réponse.

Dernière modification par jean@adimp.ch (05 Jan 2010 10:44:12)

jean@adimp.ch · 05 Jan 2010 11:28:23

Salut,
En fait la solution que j'ai choisie est VietOCR http://vietocr.sf.net/ . Il est basé sur tesserat. Il faut rajouter les langues ( par exemple le français ) dans le répertoire tesserat/tessdata. Le logiciel reconnait tout seul l'ajout de nouvelles langues.

Meilleures salutations.

PS : aprés il est nécessaire de traiter le texte avec open office et de rechercher les fautes d'orthographe, bien utile ce dictionnaire français dans open office, la fonction remplacer est aussi utile car le logiciel OCR se plante toujours au même endroit ( logique, c'est un programme ).

Dernière modification par jean@adimp.ch (05 Jan 2010 12:07:22)

Swisslinux.org

− Le carrefour GNU/Linux en Suisse −

Recherche

Menu

Forum

Identification

Inscription

Langue

Le Forum

#1 05 Jan 2010 10:41:26

[ OCR ] Logiciel OCR ( résolu )

#2 05 Jan 2010 11:28:23

Re: [ OCR ] Logiciel OCR ( résolu )

Pied de page des forums