• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

OCR Software

compi

Member
Gibt es eine gute OCR Texterkennungssoftware für Linux? gocr und ocrad erkennen nur reinen Text keine Formatierungen. Na ja und erlich gesagt die Texterkennung ist auch eher schlecht als recht.

Ich stelle mir so was in der Art von Omipage vor. Das auch Formatierungen erkannt werden und das Ergebniss in Openoffice importiert werden kann.

Gibt es sowas?

Gruß
compi
 

edgarkls

Hacker
Google lässt gerade Tesseract (ehemals von HP entwickelt und vor einigen Jahren auf Eis gelegt) für Linux wiederaufleben. Aber es sieht so aus, als hätten die Google-Entwickler noch einen langen, beschwerlichen Weg vor sich, bevor Tesseract modernen Qualitätsansprüchen gerecht werden kann.

VueScan ist ein kommerzielles Scan- und OCR-Programm, dass ganz brauchbare Resultate liefert. http://www.hamrick.com/vsm.html

Und dann gibt's da noch OCR Shop, ebenfalls kommerziell, das auf der Omnipage-Codebasis aufgebaut ist und wahrscheinlich das mit Abstand beste - und teuerste- derzeit erhältliche OCR-Programm für die X-Welt sein dürfte. Eine auf 30 Tage limitierte Demo-Version gibt's hier:

http://www.vividata.com/be_xtr_overview.html[/url]
 
Oben