Hallo,
ich habe zwei Dinge vor, die ich nicht hinbekomme, da ich die passende Software nicht finde.
1. Ich möchte einiges einscannen und dann den Text per OCR extrahieren.
2. Ich möchte den Text aus PDF-Dateien extrahieren. Bei vielen Dokumenten funktioniert das Auswahl-Werkzeug für Text nicht.
Ich habe im Netz natürlich Hinweise zu ABBYY und tesseract gefunden. Aber ich habe keinen Weg entdeckt, diese Programme per YAST zu installieren. Die Installation von *.tar.gz-Dateien traue ich mir nicht zu. Die Beschreibungen scheinen immer für Leute gedacht, die eigentlich wissen, wie es geht.
Meine Software:
openSUSE 13.1
KDE 4.11.5
Adobe Reader 9.4.2
Okular 0.17.5
XSane 0.998
Habe ich noch etwas vergessen?
Am liebsten wären mir Repositories, die ich unter YaST einbinden kann, damit auch die Abhängigkeiten aufgelöst werden.
Ach ja. Ich habe versucht, hier nach PDF und OCR zu suchen. Diese Suchbegriffe führten aber nur zu der Meldung "Es wurden keine passenden Ergebnisse gefunden.".
Liebe Grüße
Mike Merten
ich habe zwei Dinge vor, die ich nicht hinbekomme, da ich die passende Software nicht finde.
1. Ich möchte einiges einscannen und dann den Text per OCR extrahieren.
2. Ich möchte den Text aus PDF-Dateien extrahieren. Bei vielen Dokumenten funktioniert das Auswahl-Werkzeug für Text nicht.
Ich habe im Netz natürlich Hinweise zu ABBYY und tesseract gefunden. Aber ich habe keinen Weg entdeckt, diese Programme per YAST zu installieren. Die Installation von *.tar.gz-Dateien traue ich mir nicht zu. Die Beschreibungen scheinen immer für Leute gedacht, die eigentlich wissen, wie es geht.
Meine Software:
openSUSE 13.1
KDE 4.11.5
Adobe Reader 9.4.2
Okular 0.17.5
XSane 0.998
Habe ich noch etwas vergessen?
Am liebsten wären mir Repositories, die ich unter YaST einbinden kann, damit auch die Abhängigkeiten aufgelöst werden.
Ach ja. Ich habe versucht, hier nach PDF und OCR zu suchen. Diese Suchbegriffe führten aber nur zu der Meldung "Es wurden keine passenden Ergebnisse gefunden.".
Liebe Grüße
Mike Merten