Diese Website existiert nur weil wir Werbung mit AdSense ausliefern.
Bitte den AdBlocker daher auf dieser Website ausschalten! Danke.

[UNgelöst] wget zieht Umlaute nicht korrekt

Alles rund um die verschiedenen Konsolen und shells sowie die Programmierung unter Linux

Moderator: Moderatoren

Antworten
Fats
Member
Member
Beiträge: 86
Registriert: 18. Nov 2006, 13:12

[UNgelöst] wget zieht Umlaute nicht korrekt

Beitrag von Fats »

Hallo,

ich versuche ene Webseite mittels wget zu "mirroren". Befehl sieht etwa folgendermaßen aus:

Code: Alles auswählen

wget -p --convert-links --header='Accept-Charset: ISO-8859-1' -m http://www.meineseite.de
Leider werden dabei die Umlaute in den Texten der Webseite vermurkst. Ein "für" sieht dann zB. so aus: "für"

Der DocType der HTML Seiten sieht so aus:

Code: Alles auswählen

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
und der header in den HTMLs wird so gesetzt

Code: Alles auswählen

<meta http-equiv="content-type" content="text/html;charset=iso-8859-1">
Hat jemand eine Idee, wo der Fehler liegt?

Gruß
Fats
Zuletzt geändert von Fats am 4. Okt 2008, 13:54, insgesamt 1-mal geändert.
gropiuskalle
Guru
Guru
Beiträge: 4603
Registriert: 20. Nov 2007, 15:17
Wohnort: Berlin
Kontaktdaten:

Re: wget zieht Umlaute nicht korrekt

Beitrag von gropiuskalle »

Sollte so eigentlich hinhauen - bei mir funktioniert dieser Aufruf inklusiver der Umlaute einwandfrei. Nur 'ne Mutmaßung: eventuell sind die gezogenen Daten einwandfrei und lediglich die Art und Weise, wie Du sie darstellen lässt, stimmt nicht ganz (Aufruf über cat in einer Konsole mit vermurkster Zeichenkodierung oder sowas...).
Fats
Member
Member
Beiträge: 86
Registriert: 18. Nov 2006, 13:12

Re: wget zieht Umlaute nicht korrekt

Beitrag von Fats »

Hmmm ... ich ziehe die Daten von Server A rüber auf Server B und lasse sie mir dort mittels Browser anzeigen. Und bei der Anzeige gibt es den Murks. Auch im HTML-Code stehen die kaputten Umlaute.

Ich hab mal eben so eine HTML Datei im emacs (jaja, ich weiß vi ist cooler ;) ) geöffnet und dort hab ich die ganzen ^M ReturnZeichen drin! Das "Dumme" ist, daß diese Dateien, dort auf dem anderen Server manuel angelegt wurden. Und der andere Server ist auch n Linux Maschinsche ... wenns wenigstens ne WindosKiste wäre, klar! Aber sooo ... äh? :???:

Falls jemand noch ne Idee hat ... ?! Wäre super! :)

Viele Grüße
Fats
Fats
Member
Member
Beiträge: 86
Registriert: 18. Nov 2006, 13:12

Re: wget zieht Umlaute nicht korrekt

Beitrag von Fats »

Hallo miteinander,

will doch nochmal kurz "hören", ob nicht jemand zu meinem Problem eine Idee hat ...
Würde mich freuen! :-)

viele Grüße
Fats
MusiKater
Newbie
Newbie
Beiträge: 1
Registriert: 26. Nov 2015, 21:25

Re: [UNgelöst] wget zieht Umlaute nicht korrekt

Beitrag von MusiKater »

Bisschen spät, aber bei mir hat folgendes geholfen:
wget www.adresse.de --restrict-file-names=nocontrol
Antworten