OCR

Aus Linupedia
Wechseln zu: Navigation, Suche

OCR

Anleitung für OCR

Stand von April 2014

Die eigentliche Engine zum "Entziffern" von Buchstaben heißt tesseract und die gibt es schon sehr lange. Der Aufruf erfolgt über die Kommandozeile:

tesseract Bilddatei Textdateiname -l sprache

Die vorhandenen Sprachdateien befinden sich im Paket traineddata

Tesseract hat inzwischen die Version 3.x und es gibt einer grafische Oberfläche dazu: tesseract-gui.

Gefunden habe ich die Pakete u.a. hier: openSUSE 13.1, openSUSE 12.3

Diese Quelle in YaST einbinden diese Pakete installieren:

   tesseract
   tesseract-gui

Und natürlich eine oder mehrere Sprachdatei, z.B.

   tersseract-traineddata-german

und die Abhängigen natürlich. Danach existiert im Menüpunkt "Grafik" ein passender Eintrag auf die GUI. Hier wählt man oben die Bilddatei(en), klickt darunter diejenige an, die man jetzt lesen möchte und piekt mit der Maus in das Bildfenster. Der Mauszeiger wird im Bildfenster zu einem kleinen Rechteck, nach dem Klick verschwindet das Rechteck und man kann ein Rechteck um den Bereich ziehen, der bearbeitet werden soll. Weiter unten findet sich ein Dropdown-Menü "language", mit dem man nur beim ersten Start die Sprache einstellt. Zuletzt auf den Button "Ausführen" klicken und wenige Sekunden später steht das Ergebnis in einer Datei mit dem 'basename' von oben und der Extension ".txt" dahinter.