nbkr
Guru
Hallo,
um der Postflut im Büro Herr zu werden habe ich mir was ausgedacht wie ich die Post möglichst einfach in PDFs wandeln kann. Dabei soll pro Brief nur eine PDF entstehen. Es soll also nicht jedes Blatt in eine PDF gewandelt werden, sonderen mehrere Blätter zu einem zusammengefügt werden.
Gleichzeitig will ich alle Briefe auf einmal scannen, also nicht nach jede Brief absetzen. Folgendermaßen läuft das ganze bis jetzt:
Ich sortiere alle Briefe zusammen und scanne sie mit scanimage --batch ein. Zwischen den einzelnen Briefen lasse ich den Flachbettscanner einmal leer laufen, also ohne das ein Blatt drauf liegt. Dadurch erhalte ich ein komplett schwarzes Bild.
Anschließend lasse ich die Einzelbilder mit identify (von Imagemagick) analysieren. Hat ein Bild weniger als 150 Farben, werte ich es als "schwarzes Bild". Dadurch weiß ich wann ein neuer Brief anfängt und kann die einzelnen Bildern so Briefen zuordnen.
Abschließend die Bilder noch mit convert, ps2pdf und pdftk zu PDFs umwandeln und fertig.
Ich hoffe das war einleutend soweit. Jetzt will ich das ganze noch weiter automatisieren in dem ich mir einen Duplexfähigen Scanner mit automatischem Einzug und "Endeerkennung" besorge und statt dem "Leerlauf" ein Trennblatt verwende. Dadurch kann ich den Scanner alleine laufen lassen ohne daneben stehen zu müssen.
Damit das Gruppieren der Bilder zu Briefen aber auch mit einem Trennblatt sauber funktioniert muss ich dieses Trennblatt irgendwie identifizieren können. Ich habe auf das Trennblatt ein Linienmuster gedruckt.
Jetzt die Frage:
1. Kann jemand einen guten Scanner empfehlen der Duplexfähig ist, etc.
2. Kann ich auf der Konsole irgendwie eine Bilderkennung durchführen, welche auch mit nicht 100% identischen Bilder klar kommt (md5 Summe fällt also weg)?
Für jeden Tipp bin ich dankbar!
Gruß
nbkr
um der Postflut im Büro Herr zu werden habe ich mir was ausgedacht wie ich die Post möglichst einfach in PDFs wandeln kann. Dabei soll pro Brief nur eine PDF entstehen. Es soll also nicht jedes Blatt in eine PDF gewandelt werden, sonderen mehrere Blätter zu einem zusammengefügt werden.
Gleichzeitig will ich alle Briefe auf einmal scannen, also nicht nach jede Brief absetzen. Folgendermaßen läuft das ganze bis jetzt:
Ich sortiere alle Briefe zusammen und scanne sie mit scanimage --batch ein. Zwischen den einzelnen Briefen lasse ich den Flachbettscanner einmal leer laufen, also ohne das ein Blatt drauf liegt. Dadurch erhalte ich ein komplett schwarzes Bild.
Anschließend lasse ich die Einzelbilder mit identify (von Imagemagick) analysieren. Hat ein Bild weniger als 150 Farben, werte ich es als "schwarzes Bild". Dadurch weiß ich wann ein neuer Brief anfängt und kann die einzelnen Bildern so Briefen zuordnen.
Abschließend die Bilder noch mit convert, ps2pdf und pdftk zu PDFs umwandeln und fertig.
Ich hoffe das war einleutend soweit. Jetzt will ich das ganze noch weiter automatisieren in dem ich mir einen Duplexfähigen Scanner mit automatischem Einzug und "Endeerkennung" besorge und statt dem "Leerlauf" ein Trennblatt verwende. Dadurch kann ich den Scanner alleine laufen lassen ohne daneben stehen zu müssen.
Damit das Gruppieren der Bilder zu Briefen aber auch mit einem Trennblatt sauber funktioniert muss ich dieses Trennblatt irgendwie identifizieren können. Ich habe auf das Trennblatt ein Linienmuster gedruckt.
Jetzt die Frage:
1. Kann jemand einen guten Scanner empfehlen der Duplexfähig ist, etc.
2. Kann ich auf der Konsole irgendwie eine Bilderkennung durchführen, welche auch mit nicht 100% identischen Bilder klar kommt (md5 Summe fällt also weg)?
Für jeden Tipp bin ich dankbar!
Gruß
nbkr