Swisslinux.org

− Le carrefour GNU/Linux en Suisse −

 

Langue

 

Le Forum

Vous n'êtes pas identifié.

#1 17 Mar 2017 19:29:14

François Marthaler
Modérateur
Lieu: Prilly
Date d'inscription: 07 Sep 2013
Messages: 2872
Site web

[Résolu] Scanner avec reconnaissance optique des caractères (OCR)

Un client nous demande si le scanner de l'imprimante Brother DCP-9020CDW peut scanner en reconnaissant les caractères (OCR).


laptop why! NV41MZ, Intel Core i7-1165G7, RAM 16 Gb, Ubuntu 22.04 LTS

Hors ligne

 

#2 17 Mar 2017 19:42:31

François Marthaler
Modérateur
Lieu: Prilly
Date d'inscription: 07 Sep 2013
Messages: 2872
Site web

Re: [Résolu] Scanner avec reconnaissance optique des caractères (OCR)

En fait, cela ne dépend par de l'imprimante ou du scanner, mais du logiciel de numérisation qui est ou n'est pas équipé de la reconnaissance optique de caractères.

Par défaut, les ordinateurs why! ont SimpleScan comme utilitaire de numérisation (sans OCR). Avec Ubuntu 16.04, la logithèque propose notamment ce qui suit en réponse à une recherche "OCR":
- OCRFeeder (j'ai réussi à l'installer, mais pas à le lancer...)
- gscan2pdf (testé sur le journal communal avec une mise en page sur 4 colonnes, mais ce n'est pas très probant...)

J'imagine que le sujet est complexe. Il n'y a qu'à penser aux séparateurs de mots sur deux lignes pour comprendre qu'on n'aura jamais un résultat comparable à un texte sous la forme d'un fichier texte, ni même PDF.

Il existe certainement des logiciels plus performants et pas nécessairement libres... On est toujours preneur...

Cordialement.


laptop why! NV41MZ, Intel Core i7-1165G7, RAM 16 Gb, Ubuntu 22.04 LTS

Hors ligne

 

#3 17 Mar 2017 19:42:59

jean@adimp.ch
Illuminé(e)
Lieu: Marly
Date d'inscription: 10 Mar 2005
Messages: 1228
Site web

Re: [Résolu] Scanner avec reconnaissance optique des caractères (OCR)

Bonjour,
Il existe des super logiciels ocr tel celui-ci https://github.com/tesseract-ocr ( en ligne de commande ). Un gui est ici : https://github.com/zdenop/tesseract-ocr-qt4gui . Ce logiciel prend en compte plusieurs formats d'image créés par le scanner, indépendamment de la marque du scanner.
Meilleures salutations.


--------------------------------------------------------
Jean Tinguely Awais
Ma vie sur twitter : http://www.twitter.com/tservi

Hors ligne

 

#4 17 Mar 2017 21:44:05

François Marthaler
Modérateur
Lieu: Prilly
Date d'inscription: 07 Sep 2013
Messages: 2872
Site web

Re: [Résolu] Scanner avec reconnaissance optique des caractères (OCR)

Merci à jean@adimp.ch.

Il me semble que gscan2pdf intègre tesseract-ocr (voir http://gscan2pdf.sourceforge.net/). Pour l'utilisateur lambda, il faudrait juste un petit tutoriel permettant de récupérer rapidement le texte d'une lettre ou d'un document simple. Sans y passer plus de temps que ce qu'il en faut pour retaper le texte en question... ;-)

Cordialement.


laptop why! NV41MZ, Intel Core i7-1165G7, RAM 16 Gb, Ubuntu 22.04 LTS

Hors ligne

 

Pied de page des forums

Powered by FluxBB