Ich benötige mal wieder Euren Rat.
Kurz zur Einleitung: ich hatte gestern am Nachmittag schon das Gefühl, daß mein Desktop-Rechner irgendwie "lahm" lief, habe dem aber zunächst keine weitere Bedeutung zugemessen. Vor dem Runterfahren am Abend kontrollierte ich noch kurz, ob mein Cron-Sicherungsjob, den ich täglich um 17.15 h starte, erfolgreich war. Der rsync-Job läuft, abhängig vom veränderten Datenvolumen, zwischen einer halben und einer ganzen Minute. Laut meiner Protokolldatei dauerte er gestern 40 Minuten, endete aber ohne Fehlermeldung.
Ich nahm mir vor, die Sache am folgenden Morgen, also heute, näher zu untersuchen. Leider startete der Rechner aber nicht mehr. Eine Unmasse Fehlermeldungen wurden auf dem Monitor ausgegeben, bis ich schließlich in eine login-Situation kam. Dort wurde ich beim Versuch mich als root einzuloggen wegen angeblich inkorrekten Passworts abgewiesen.
Kurz entschlossen habe ich die meine aktuelle root- und home-Sicherung der Suse aus der laufenden Debian-Installation zurückladen wollen. Jetzt aber wurden mir Fehler in den zu schreibenden Partitionen (wrong superblock usw.) angezeigt.
Also habe ich die /dev/sda1 und die /dev/sda2 mit Gparted formatiert, die Daten zurückgeladen, Bootloader neu installiert, sowie /etc/fstab und grub.cfg angepasst.
Anschließend habe ich den Rechner mehrfach neu gestartet und mal mit openSuse, mal mit Debian betrieben. Alles lief sauber und einwandfrei. Worauf ich den Rechner für 2 Stunden ausgeschaltet ließ. Als ich aber wieder starten wollte, kam wieder der Schwall von Fehlermeldungen, wie bei ersten Mal. Allerdings mit dem Unterschied, daß mein Login als root diesmal akzeptiert wurde. Zwar konnte ich X nicht starten, aber wenigstens dmesg in eine meiner Datenpartitionen leiten. Diese befinden sich alle nicht auf der SSD. Dort sind nur die Betriebssysteme (root und home) und ein Sicherungsarchiv, welches einmal am Tag geschrieben wird.
Hier der Punkt aus dmesg, wo die Probleme beginnen :
Dieser Fehler wiederholt sich dann in dieser und ähnlicher Form massenhaft, bis ich mich dann als root einloggen kann.
Nun meine Frage: hat die SSD im Bereich der Partition 1 (und 2?) eine "Macke", da alle andere Partitionen auf der sda funktionieren? Oder liegt mir ein Problem mit dem Betriebssystem vor? Debian läuft jedenfalls in den Partitionen sda5 und sda6 sauber.
Smartctl kann zumindest nach einem Kurztest nur melden :
Was tun?
fragt H.
Kurz zur Einleitung: ich hatte gestern am Nachmittag schon das Gefühl, daß mein Desktop-Rechner irgendwie "lahm" lief, habe dem aber zunächst keine weitere Bedeutung zugemessen. Vor dem Runterfahren am Abend kontrollierte ich noch kurz, ob mein Cron-Sicherungsjob, den ich täglich um 17.15 h starte, erfolgreich war. Der rsync-Job läuft, abhängig vom veränderten Datenvolumen, zwischen einer halben und einer ganzen Minute. Laut meiner Protokolldatei dauerte er gestern 40 Minuten, endete aber ohne Fehlermeldung.
Ich nahm mir vor, die Sache am folgenden Morgen, also heute, näher zu untersuchen. Leider startete der Rechner aber nicht mehr. Eine Unmasse Fehlermeldungen wurden auf dem Monitor ausgegeben, bis ich schließlich in eine login-Situation kam. Dort wurde ich beim Versuch mich als root einzuloggen wegen angeblich inkorrekten Passworts abgewiesen.
Kurz entschlossen habe ich die meine aktuelle root- und home-Sicherung der Suse aus der laufenden Debian-Installation zurückladen wollen. Jetzt aber wurden mir Fehler in den zu schreibenden Partitionen (wrong superblock usw.) angezeigt.
Also habe ich die /dev/sda1 und die /dev/sda2 mit Gparted formatiert, die Daten zurückgeladen, Bootloader neu installiert, sowie /etc/fstab und grub.cfg angepasst.
Anschließend habe ich den Rechner mehrfach neu gestartet und mal mit openSuse, mal mit Debian betrieben. Alles lief sauber und einwandfrei. Worauf ich den Rechner für 2 Stunden ausgeschaltet ließ. Als ich aber wieder starten wollte, kam wieder der Schwall von Fehlermeldungen, wie bei ersten Mal. Allerdings mit dem Unterschied, daß mein Login als root diesmal akzeptiert wurde. Zwar konnte ich X nicht starten, aber wenigstens dmesg in eine meiner Datenpartitionen leiten. Diese befinden sich alle nicht auf der SSD. Dort sind nur die Betriebssysteme (root und home) und ein Sicherungsarchiv, welches einmal am Tag geschrieben wird.
Hier der Punkt aus dmesg, wo die Probleme beginnen :
Code:
[ 2.389979] ata1.00: exception Emask 0x10 SAct 0x1 SErr 0x400000 action 0x6 frozen
[ 2.389981] ata1.00: irq_stat 0x08000000, interface fatal error
[ 2.389982] ata1: SError: { Handshk }
[ 2.389985] ata1.00: failed command: WRITE FPDMA QUEUED
[ 2.389989] ata1.00: cmd 61/08:00:08:26:c4/00:00:00:00:00/40 tag 0 ncq 4096 out
res 40/00:00:08:26:c4/00:00:00:00:00/40 Emask 0x10 (ATA bus error)
[ 2.389989] ata1.00: status: { DRDY }
[ 2.389994] ata1: hard resetting link
[ 2.694049] ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[ 2.694253] ata1.00: supports DRM functions and may not be fully accessible
[ 2.694474] ata1.00: supports DRM functions and may not be fully accessible
[ 2.694477] ata1.00: configured for UDMA/133
[ 2.694486] ata1: EH complete
Nun meine Frage: hat die SSD im Bereich der Partition 1 (und 2?) eine "Macke", da alle andere Partitionen auf der sda funktionieren? Oder liegt mir ein Problem mit dem Betriebssystem vor? Debian läuft jedenfalls in den Partitionen sda5 und sda6 sauber.
Smartctl kann zumindest nach einem Kurztest nur melden :
Code:
SMART overall-health self-assessment test result: PASSED
und
SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0
9 Power_On_Hours 0x0032 099 099 000 Old_age Always - 379
12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 244
177 Wear_Leveling_Count 0x0013 099 099 000 Pre-fail Always - 2
179 Used_Rsvd_Blk_Cnt_Tot 0x0013 100 100 010 Pre-fail Always - 0
181 Program_Fail_Cnt_Total 0x0032 100 100 010 Old_age Always - 0
182 Erase_Fail_Count_Total 0x0032 100 100 010 Old_age Always - 0
183 Runtime_Bad_Block 0x0013 100 100 010 Pre-fail Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0032 074 060 000 Old_age Always - 26
195 Hardware_ECC_Recovered 0x001a 200 200 000 Old_age Always - 0
199 UDMA_CRC_Error_Count 0x003e 099 099 000 Old_age Always - 403
235 Unknown_Attribute 0x0012 099 099 000 Old_age Always - 69
241 Total_LBAs_Written 0x0032 099 099 000 Old_age Always - 1153202034
SMART Error Log Version: 1
No Errors Logged
Was tun?
fragt H.