Hallo,
in einem kleinen IT-Projekt von mir kopieren Windows-Nutzer mit WinSCP Dateien in Ordner meines SUSE-Servers, die anschließend über einen Apache-Webserver veröffentlicht werden.
Dummerweise "vergessen" die Windows-Nutzer es gelegentlich, Leerzeichen bzw. Umlaute in den Dateinamen vor dem Kopieren mit WinSCP zu verändern. (Beispiel: "Abschluß März.pdf").
Damit der Webserver mit den Dateien zurecht kommt, ersetze ich mit sed die Leerzeichen durch "_". Aber die Umlaute kann ich mit sed nicht behandeln.
sed 's/ä/ae/g' schlägt fehl, da das "ä" von einem Windowsrechner mit wohl anderem Zeichensatz erzeugt wurde. Ein ls -b gibt hier statt "ä" ein \344 aus.
Weiß jemand, wie man die Umlaute so konvertiert, dass nur Buchstaben, Ziffern und "_" in den Dateinamen auftauchen? (Es muss ja nicht unbedingt sed sein ...)
in einem kleinen IT-Projekt von mir kopieren Windows-Nutzer mit WinSCP Dateien in Ordner meines SUSE-Servers, die anschließend über einen Apache-Webserver veröffentlicht werden.
Dummerweise "vergessen" die Windows-Nutzer es gelegentlich, Leerzeichen bzw. Umlaute in den Dateinamen vor dem Kopieren mit WinSCP zu verändern. (Beispiel: "Abschluß März.pdf").
Damit der Webserver mit den Dateien zurecht kommt, ersetze ich mit sed die Leerzeichen durch "_". Aber die Umlaute kann ich mit sed nicht behandeln.
sed 's/ä/ae/g' schlägt fehl, da das "ä" von einem Windowsrechner mit wohl anderem Zeichensatz erzeugt wurde. Ein ls -b gibt hier statt "ä" ein \344 aus.
Weiß jemand, wie man die Umlaute so konvertiert, dass nur Buchstaben, Ziffern und "_" in den Dateinamen auftauchen? (Es muss ja nicht unbedingt sed sein ...)