• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

Selektiv PDFs aus Zips extrahieren.

Flash

Member
Angenommen ihr habt einen Ordner voller ZIPs. In diesen ZIPs sind Text-PDFs gespeichert.

Ich habe diesen Codeschnipsel um alle PDFs mit einem bestimmten String in den ZIPs zu finden:
Code:
#!/bin/bash
for z in *.zip
do
  zipinfo -1 "$z" |  # Get the list of filenames in the zip file
    while IFS= read -r f
    do
      unzip -p "$z" "$f" | # Extract each PDF to standard output instead of a file
        pdftotext - - | # Then convert it to text, reading from stdin, writing to stdout
        grep -q 1234 && echo "$z -> $f" # And finally grep the text
    done
done

Wie schreibe ich das um, dass
1. der Suchstring (hier 1234) als parameter übergeben werden kann
2. das gefundene PDF extrahiert und abgespeichert wird.
 

abgdf

Guru
Funktioniert der Code-Schnipsel denn? Hast Du ihn schonmal auf nur zwei pdfs (eins mit dem String, eines ohne den String) (von Deinen pdfs!) getestet? Wenn nicht, dann mach' das erstmal.
 
Oben