Vous n'êtes pas identifié.
Pages: 1
Un client nous demande si le scanner de l'imprimante Brother DCP-9020CDW peut scanner en reconnaissant les caractères (OCR).
Hors ligne
En fait, cela ne dépend par de l'imprimante ou du scanner, mais du logiciel de numérisation qui est ou n'est pas équipé de la reconnaissance optique de caractères.
Par défaut, les ordinateurs why! ont SimpleScan comme utilitaire de numérisation (sans OCR). Avec Ubuntu 16.04, la logithèque propose notamment ce qui suit en réponse à une recherche "OCR":
- OCRFeeder (j'ai réussi à l'installer, mais pas à le lancer...)
- gscan2pdf (testé sur le journal communal avec une mise en page sur 4 colonnes, mais ce n'est pas très probant...)
J'imagine que le sujet est complexe. Il n'y a qu'à penser aux séparateurs de mots sur deux lignes pour comprendre qu'on n'aura jamais un résultat comparable à un texte sous la forme d'un fichier texte, ni même PDF.
Il existe certainement des logiciels plus performants et pas nécessairement libres... On est toujours preneur...
Cordialement.
Hors ligne
Bonjour,
Il existe des super logiciels ocr tel celui-ci https://github.com/tesseract-ocr ( en ligne de commande ). Un gui est ici : https://github.com/zdenop/tesseract-ocr-qt4gui . Ce logiciel prend en compte plusieurs formats d'image créés par le scanner, indépendamment de la marque du scanner.
Meilleures salutations.
Hors ligne
Merci à jean@adimp.ch.
Il me semble que gscan2pdf intègre tesseract-ocr (voir http://gscan2pdf.sourceforge.net/). Pour l'utilisateur lambda, il faudrait juste un petit tutoriel permettant de récupérer rapidement le texte d'une lettre ou d'un document simple. Sans y passer plus de temps que ce qu'il en faut pour retaper le texte en question... ;-)
Cordialement.
Hors ligne
Pages: 1