• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

Bilderkennung?

nbkr

Guru
Hallo,

um der Postflut im Büro Herr zu werden habe ich mir was ausgedacht wie ich die Post möglichst einfach in PDFs wandeln kann. Dabei soll pro Brief nur eine PDF entstehen. Es soll also nicht jedes Blatt in eine PDF gewandelt werden, sonderen mehrere Blätter zu einem zusammengefügt werden.

Gleichzeitig will ich alle Briefe auf einmal scannen, also nicht nach jede Brief absetzen. Folgendermaßen läuft das ganze bis jetzt:

Ich sortiere alle Briefe zusammen und scanne sie mit scanimage --batch ein. Zwischen den einzelnen Briefen lasse ich den Flachbettscanner einmal leer laufen, also ohne das ein Blatt drauf liegt. Dadurch erhalte ich ein komplett schwarzes Bild.

Anschließend lasse ich die Einzelbilder mit identify (von Imagemagick) analysieren. Hat ein Bild weniger als 150 Farben, werte ich es als "schwarzes Bild". Dadurch weiß ich wann ein neuer Brief anfängt und kann die einzelnen Bildern so Briefen zuordnen.

Abschließend die Bilder noch mit convert, ps2pdf und pdftk zu PDFs umwandeln und fertig.

Ich hoffe das war einleutend soweit. Jetzt will ich das ganze noch weiter automatisieren in dem ich mir einen Duplexfähigen Scanner mit automatischem Einzug und "Endeerkennung" besorge und statt dem "Leerlauf" ein Trennblatt verwende. Dadurch kann ich den Scanner alleine laufen lassen ohne daneben stehen zu müssen.

Damit das Gruppieren der Bilder zu Briefen aber auch mit einem Trennblatt sauber funktioniert muss ich dieses Trennblatt irgendwie identifizieren können. Ich habe auf das Trennblatt ein Linienmuster gedruckt.

Jetzt die Frage(n):

1. Kann jemand einen guten Scanner empfehlen der Duplexfähig ist, etc.
2. Kann ich auf der Konsole irgendwie eine Bilderkennung durchführen, welche auch mit nicht 100% identischen Bilder klar kommt (md5 Summe fällt also weg)?

Für jeden Tipp bin ich dankbar!

Gruß
nbkr
 

abgdf

Guru
Ich hoffe das war einleutend soweit.
Ja. Sehr gute Idee !
Jetzt will ich das ganze noch weiter automatisieren in dem ich mir einen Duplexfähigen Scanner mit automatischem Einzug und "Endeerkennung" besorge und statt dem "Leerlauf" ein Trennblatt verwende. Dadurch kann ich den Scanner alleine laufen lassen ohne daneben stehen zu müssen.
Ich denke, das hängt davon ab, was der Scanner zurückgibt, wenn ein Trennblatt fällig wäre. Das wiederum hängt vom Scannermodell ab.
Kann da leider keins empfehlen mangels Erfahrung mit solchen High-End-Geräten.

Trotzdem viele Grüße
 
OP
nbkr

nbkr

Guru
Ich habe jetzt mal einen schwarzen Karton als Trennblatt verwendet. Klappt bisher auch ganz gut, allerdings muss ich mal testen ob das in der Praxis auch funktioniert. Fehlt nur noch der Scanner ...
 
OP
nbkr

nbkr

Guru
Für die, welche es interesiert. Es wird wohl ein Avision AV220C2 werden. Der wird von Sane "complete" unterstützt.
 
Oben