• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

Wordpad++ / Kate Character Encoding

fhihu

Member
Hallo miteinander,

ich muss derzeit PDF Dateien, die mit einer Signatur versehen worden sind, bearbeiten, um die Metadaten zu entfernen, die immer bei einer Speicherung mit dem Adobe PDF Reader hinzugefügt werden.

Mir wurde empfohlen dazu das Programm Notepad++ zu verwenden. Mit dem kann ich die PDF-Datei öffnen, die betroffenen Adobe Metadaten entfernen, funktioniert einwandfrei.

Nun würde ich das ganze gerne unter Linux machen. Mit Kate kann ich auch die PDF-Datei öffnen, die betroffenen Zeilen entfernen und die Datei speichern. Allerdings wird bei einer Speicherung der Datei, die PDF-Datei unlesbar und auch die Signatur ist defekt. Irgendwie wird die Datei korrupt.

Ich habe leider keine Ahnung an was das liegen könnte. Meine Vermutung ist, dass es an der Zeichenkodierung liegt.

Die Zeichen sind in Notepad++ und Kate unterschiedlicht, also die Metadaten sind immer gleich und auch lesbar, aber der Rest ist irgendwie anders. Könnte es daran liegen.

Also der Wordpad++ Editor verwendet die Ansi Kodierung. Ich habe in Kate inzwischen mehrere Kodierungen ausprobiert, aber die Zeichen scheinen sich dennoch zu unterscheiden.
Welche Kodierung müsste ich genau verwenden? Oder kann das Problem eine andere Ursache haben?

Vielen Dank und beste Grüße
fhihu
 

susejunky

Moderator
Teammitglied
Hallo @fhihu ,

zu Deinem eigentlichen Problem kann ich nichts sagen aber als "schnelle Umgehungslösung" könntest Du Notepad++ auch unter Linux (mit Hilfe von wine) nutzen.

Auf meinem openSUSE Tumbleweed System nutze ich z.B. PortableApps + Notepad++ unter wine ohne Probleme.

Viele Grüße

susejunky
 

abgdf

Guru
Erste Wahl beim Arbeiten mit pdfs ist (für mich) "pdftk".
Ob das Metadaten entfernen kann? Weiß nicht, müßte man in der man-Seite gucken. Könnte aber sein.
 

abgdf

Guru
Käme eventuell "notepadqq" in Frage?
Er will Signaturen in pdfs editieren, also Metadaten von pdfs, möglicherweise XMP Metadaten. Ich sehe nicht, daß man das mit notepadqq kann, das scheint mir lediglich ein (weiterer) Text-Editor für Programmierer zu sein.
Mit Python könnte man vielleicht das "Python XMP Toolkit" verwenden und sich ein passendes Skript schreiben.

(Sowas ähnliches, also Metadaten in Content-Dateien schreiben, hatte ich ja 2021 schonmal gemacht. Dort Bilddateien/IPTC, hier pdf/XMP.)
 
Zuletzt bearbeitet:
Oben