• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

Wie Sprachübersetzung von Fotokopie

lewendi

Advanced Hacker
Servus zusammen,

ich habe einige Dokumente in griechischer Sprache, welche ich mit "IM Translater" bzw. "Google Translate" ins deutsche übersetzen möchte?
Wie kann ich das am besten machen, ohne die Dokumente mühsam abtippen zu müssen?

Ich habe die Möglichkeit die Dokumente Einzuscannen oder abfotografieren. Mit beiden Möglichkeiten kann ich aber den Text nicht markieren -> kopieren -> und dann im Übersetzungsprogramm einfügen und übersetzen lassen.

Gibt es eine Möglichkeit, das zu bewerkstelligen, es sind ja doch ca. 50 DIN A4 Seiten und da schreibst schon lange mit den griechischen Buchstaben.

Gruß
lewendi
 
Interessante Problemstellung, die ich selbst so noch nicht hatte. Meiner Meinung nach sollte es mit einer OCR Software möglich sein den eingescannten Test in "echten" Text umzuwandeln. Jetzt kann dieser Text in einen beliebigen Übersetzter kopiert und übersetzt werden.
Beim Suchen bin ich auf die Software FineReader gestoßen, die scheinbar sogar unter Linux funktioniert. Nachdem die erweiterte Lizenz Arabische, Chinesische, Japanische und Koreanische Sprache unterstützt sehe ich gute Chance, dass Griechisch in der Standardversion funktioniert. Die Testversion erlaubt eine Umwandlung bis zu 100 Seiten...
Ich kenne die Software leider nicht - aber sie scheint einen guten Eindruck zu machen...
Vielleicht kennt jemand diese oder eine andere Software mit der er schon Erfahrung hat?
 
Toll, das Programm kannte ich noch gar nicht - scheint aber für die Problemstellung des Themenerstellers optimal zu sein. Da man sowas sicherlich mal gebrauchen kann, wollte ich mir die Software gleich installieren. Der Repositorylink im verlinkten Beitrag funktioniert leider nicht. Ich habe aber festgestellt, dass tesseract auch im Opensuse-13.1-Oss Repository gefunden wird - allerdings ohne GUI. Die ist aber für mich nicht so wichtig... Es gibt auch eine tesseract-trainedata-greek die levendi für sein Problem installieren sollte. Ein erster Test mit dem Kommandozeilentool eines Deutschen Textes brachte ein ganz passables Ergebnis...
 
Für tesseract gibt's natürlich auch eine GUI, die sich im Home-verzeichnis von Malcolm Lewis befindet: gimage-reader. Sehr leicht zu bedienen und recht komfortabel. Für griechisch sollten allerdings dann auch die entsprechenden Sprachpakete für tesseract installiert werden.

CU Freddie
 
OP
lewendi

lewendi

Advanced Hacker
Vielen Dank,

werde die Sache mal testen wenn ich Ende Oktober in Deutschland bin und berichten ob es funktioniert.

Gruß
lewendi
 
Oben