[erledigt]Fehler Samsung SSD 840 EVO ?

halo44 · 11 Juli 2014

Ich benötige mal wieder Euren Rat.

Kurz zur Einleitung: ich hatte gestern am Nachmittag schon das Gefühl, daß mein Desktop-Rechner irgendwie "lahm" lief, habe dem aber zunächst keine weitere Bedeutung zugemessen. Vor dem Runterfahren am Abend kontrollierte ich noch kurz, ob mein Cron-Sicherungsjob, den ich täglich um 17.15 h starte, erfolgreich war. Der rsync-Job läuft, abhängig vom veränderten Datenvolumen, zwischen einer halben und einer ganzen Minute. Laut meiner Protokolldatei dauerte er gestern 40 Minuten, endete aber ohne Fehlermeldung.

Ich nahm mir vor, die Sache am folgenden Morgen, also heute, näher zu untersuchen. Leider startete der Rechner aber nicht mehr. Eine Unmasse Fehlermeldungen wurden auf dem Monitor ausgegeben, bis ich schließlich in eine login-Situation kam. Dort wurde ich beim Versuch mich als root einzuloggen wegen angeblich inkorrekten Passworts abgewiesen.

Kurz entschlossen habe ich die meine aktuelle root- und home-Sicherung der Suse aus der laufenden Debian-Installation zurückladen wollen. Jetzt aber wurden mir Fehler in den zu schreibenden Partitionen (wrong superblock usw.) angezeigt.

Also habe ich die /dev/sda1 und die /dev/sda2 mit Gparted formatiert, die Daten zurückgeladen, Bootloader neu installiert, sowie /etc/fstab und grub.cfg angepasst.

Anschließend habe ich den Rechner mehrfach neu gestartet und mal mit openSuse, mal mit Debian betrieben. Alles lief sauber und einwandfrei. Worauf ich den Rechner für 2 Stunden ausgeschaltet ließ. Als ich aber wieder starten wollte, kam wieder der Schwall von Fehlermeldungen, wie bei ersten Mal. Allerdings mit dem Unterschied, daß mein Login als root diesmal akzeptiert wurde. Zwar konnte ich X nicht starten, aber wenigstens dmesg in eine meiner Datenpartitionen leiten. Diese befinden sich alle nicht auf der SSD. Dort sind nur die Betriebssysteme (root und home) und ein Sicherungsarchiv, welches einmal am Tag geschrieben wird.

Hier der Punkt aus dmesg, wo die Probleme beginnen :

Code:

[    2.389979] ata1.00: exception Emask 0x10 SAct 0x1 SErr 0x400000 action 0x6 frozen
[    2.389981] ata1.00: irq_stat 0x08000000, interface fatal error
[    2.389982] ata1: SError: { Handshk }
[    2.389985] ata1.00: failed command: WRITE FPDMA QUEUED
[    2.389989] ata1.00: cmd 61/08:00:08:26:c4/00:00:00:00:00/40 tag 0 ncq 4096 out
         res 40/00:00:08:26:c4/00:00:00:00:00/40 Emask 0x10 (ATA bus error)
[    2.389989] ata1.00: status: { DRDY }
[    2.389994] ata1: hard resetting link
[    2.694049] ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[    2.694253] ata1.00: supports DRM functions and may not be fully accessible
[    2.694474] ata1.00: supports DRM functions and may not be fully accessible
[    2.694477] ata1.00: configured for UDMA/133
[    2.694486] ata1: EH complete

Dieser Fehler wiederholt sich dann in dieser und ähnlicher Form massenhaft, bis ich mich dann als root einloggen kann.

Nun meine Frage: hat die SSD im Bereich der Partition 1 (und 2?) eine "Macke", da alle andere Partitionen auf der sda funktionieren? Oder liegt mir ein Problem mit dem Betriebssystem vor? Debian läuft jedenfalls in den Partitionen sda5 und sda6 sauber.

Smartctl kann zumindest nach einem Kurztest nur melden :

Code:

SMART overall-health self-assessment test result: PASSED
und
SMART Attributes Data Structure revision number: 1
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       379
 12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       244
177 Wear_Leveling_Count     0x0013   099   099   000    Pre-fail  Always       -       2
179 Used_Rsvd_Blk_Cnt_Tot   0x0013   100   100   010    Pre-fail  Always       -       0
181 Program_Fail_Cnt_Total  0x0032   100   100   010    Old_age   Always       -       0
182 Erase_Fail_Count_Total  0x0032   100   100   010    Old_age   Always       -       0
183 Runtime_Bad_Block       0x0013   100   100   010    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0032   074   060   000    Old_age   Always       -       26
195 Hardware_ECC_Recovered  0x001a   200   200   000    Old_age   Always       -       0
199 UDMA_CRC_Error_Count    0x003e   099   099   000    Old_age   Always       -       403
235 Unknown_Attribute       0x0012   099   099   000    Old_age   Always       -       69
241 Total_LBAs_Written      0x0032   099   099   000    Old_age   Always       -       1153202034

SMART Error Log Version: 1
No Errors Logged

Was tun?

fragt H.

halo44 · 11 Juli 2014

Ein weitere interessante Information. Hier das was "blkid" sagt, soweit es die SSD betrifft :

Code:

root@dt-debian:~# blkid
/dev/sda1: LABEL="rgot-opensuse" UUID="a75ff376-1a52-42b2-bc71-411784d29895" TYPE="ext4" EXT_JOURNAL="00000000-0000-0000-0000-000000001e00" 
/dev/sda5: LABEL="root-debian" UUID="b66c5fd3-caec-4b5e-88a0-14a25cb6b3cd" TYPE="ext4" 
/dev/sda6: LABEL="home-debian" UUID="ef4a7dd2-e697-4387-a271-7c0be6fa858c" TYPE="ext4" 
/dev/sda7: UUID="26aa9879-5cd2-47c4-89c5-8a04ce750544" TYPE="crypto_LUKS" 
/dev/sda3: UUID="35d7db25-5daf-4826-8dbf-8cee0129869e" TYPE="swap" 
/dev/sda8: LABEL="Daten-Kopien" UUID="b6a13539-a92d-40f0-a0bc-a722e625c2ce" TYPE="ext4"

Die Information über die home-Partition (sda2) von openSuse fehlt ganz. Das Label der root-Partition wurde auf "rgot-opensuse" verfälscht. Der Buchstabe g ist wirklich ein o.

Will ich von Debian aus auf die Partition zugreifen, so erhalte ich dort die Meldung

Code:

Beim Zugriff auf "rgot-opensuse" ist ein Fehler aufgetreten, die Meldung lautet:
Der Kernel-Treiber für dieses Dateisystem ist nicht verfügbar ....

Dies veranlasste mich nochmal in die Meldungstexte zu sehen. Vermutlich bin ich dort 11 Zeilen vor dem erwähnten Start der Fehlermeldungen fündig geworden:

Code:

[    2.036537] Btrfs loaded

Wo kann ich nachsehen, wie die Suse auf diese Idee kommt?

Gruss H.

josef-wien · 11 Juli 2014

halo44 schrieb:
Wo kann ich nachsehen, wie die Suse auf diese Idee kommt?

Das Modul btrfs wird bedingungslos in der initrd (durch einen modprobe-Befehl in /boot/81-btrfs.sh) geladen. Wenn Dich das stört und Du btrfs nicht brauchst, sollte die Entfernung des Pakets btrfsprogs Abhilfe schaffen. Mit Deinem Problem hat das aber nichts zu tun.

halo44 schrieb:
Also habe ich die /dev/sda1 und die /dev/sda2 mit Gparted formatiert, die Daten zurückgeladen

Greifen kann ich Dein Problem noch nicht, es scheint mir eher bei der SSD zu liegen. Was sagen zur Sicherheit:

Code:

parted /dev/sda print
fdisk -l /dev/sda
e2fsck -f /dev/sda1
e2fsck -f /dev/sda2

halo44 · 12 Juli 2014

Da ich nicht mehr zu einem akzeptierten Login bei der Suse komme, hier die Ausführung unter Debian :

Code:

root@dt-debian:~# parted /dev/sda print
-su: parted: Kommando nicht gefunden.
root@dt-debian:~# parted /dev/sda print
Model: ATA Samsung SSD 840 (scsi)
Disk /dev/sda: 250GB
Sector size (logical/physical): 512B/512B
Partition Table: msdos

Number  Start   End     Size    Type      File system     Flags
 1      1049kB  16,1GB  16,1GB  primary   ext4
 2      16,1GB  21,5GB  5369MB  primary
 3      21,5GB  23,6GB  2147MB  primary   linux-swap(v1)
 4      23,6GB  228GB   204GB   extended
 5      23,6GB  32,2GB  8590MB  logical   ext4
 6      32,2GB  36,5GB  4295MB  logical   ext4
 7      36,5GB  208GB   172GB   logical
 8      208GB   228GB   19,3GB  logical   ext4

Code:

root@dt-debian:~# fdisk -l /dev/sda 

Disk /dev/sda: 250.1 GB, 250059350016 bytes
255 heads, 63 sectors/track, 30401 cylinders, total 488397168 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x00069983

   Device Boot      Start         End      Blocks   Id  System
/dev/sda1            2048    31459327    15728640   83  Linux
/dev/sda2        31459328    41945087     5242880   83  Linux
/dev/sda3        41945088    46139391     2097152   82  Linux swap / Solaris
/dev/sda4        46139392   444598271   199229440    5  Extended
/dev/sda5        46141440    62918655     8388608   83  Linux
/dev/sda6        62920704    71309311     4194304   83  Linux
/dev/sda7        71311360   406855679   167772160   83  Linux
/dev/sda8       406857728   444598271    18870272   83  Linux

Code:

root@dt-debian:~# e2fsck -f dev/sda1
e2fsck 1.42.5 (29-Jul-2012)
e2fsck: Datei oder Verzeichnis nicht gefunden beim Versuch, dev/sda1 zu öffnen
Ist das Gerät möglicherweise nicht vorhanden?

Code:

root@dt-debian:~# e2fsck -f dev/sda2
e2fsck 1.42.5 (29-Jul-2012)
e2fsck: Datei oder Verzeichnis nicht gefunden beim Versuch, dev/sda2 zu öffnen
Ist das Gerät möglicherweise nicht vorhanden?

Gruss H.

halo44 · 12 Juli 2014

Beim e2fsck habe ich einen / unterschlagen. Entschuldigung!

Inzwischen tritt der Fehler auch unter Debian auf, d.h. im Moment komme ich nur zu einem Terminal-Login.

Daher jetzt die korrekte Wiederholung des e2fsck :

Code:

root@dt-debian:~# e2fsck -f /dev/sda1
e2fsck 1.42.5 (29-Jul.-2012)
/dev/sda1 besitzt nicht unterstützte Eigenschaft(en): FEATURE_R2
e2fsck: Neuere Version von e2fsck benötigt!

Bei /dev/sda2 eine abweichende Ausgabe :

Code:

root@dt-debian:~# e2fsck -f /dev/sda1
e2fsck 1.42.5 (29-Jul.-2012)
ext2fs_open2: Ungültige magische Zahl im Superblock
e2fsck: Superblock ungültig versuche es mit Backup-Blöcken...
Durchgang 1: Prüfe Inodes, Blocks, und Größen
Durchgang 2: Prüfe Verzeichnisstruktur
Durchgang 3: Prüfe Verzeichnisverknüpfungen
Durchgang 4: Überprüfe die Referenzzähler
Durchgang 5: Überprüfe Gruppe Zusammenfassung
Die Anzahl freier Blöcke in Gruppe #0 ist falsch (24217, gezählt=22203).
Repariere<j>?

Den Reparaturversuch habe ich nicht unternommen, da ich mir davon keine dauerhafte Lösung verspreche. Zumal ja dann noch das Problem mit sda1 bliebe.

Gibts eine Möglichkeit die SSD abseits von smartctl, da ja dies keine Fehler zeigt, zu untersuchen?

Gruss H.

josef-wien · 12 Juli 2014

halo44 schrieb:
SMART overall-health self-assessment test result: PASSED

Das sagt gar nichts aus, da wird das Medium nur gefragt, ob es sich gut fühlt. Führe

Code:

smartctl -t long /dev/sda

aus, nach einiger Zeit kannst Du das Ergebnis mit

Code:

smartctl -l error -l selftest /dev/sda

begutachten. Ansonsten schau Dich beim Hersteller um, ob der ein Prüfprogramm zur Verfügung stellt.

halo44 schrieb:
Den Reparaturversuch habe ich nicht unternommen, da ich mir davon keine dauerhafte Lösung verspreche. Zumal ja dann noch das Problem mit sda1 bliebe.

Dem ersten Satz stimme ich zu. Beim zweiten Satz könnten die "veralteten" Routinen von Debian mit dem Dateisystem nicht mehr zurechtkommen, das Rettungssystem der openSUSE-DVD (bzw. die GParted-Live-CD) müßte dann andere Ergebnisse zeigen.

halo44 · 12 Juli 2014

Der lange Test (80 Minuten) endet mit

Code:

No Errors Logged

Schön für den Hersteller. Für mich eher gemischt.

Der Hersteller hat laut Website jetzt Wochenende. Auch das schön für ihn :/

Gruss H.

P.S. Ergänzend über Edit noch die beiden Zeilen

Code:

# 1 Extended offline    Completed without error  00%  0  -
# 2 Short offline       Completed without error  00%  0  -

Nochmal editiert: ich ändere das Thema, da der Fehler inzwischen auch bei Debian auftritt und die Suse nicht allein betroffen ist

halo44 · 20 Juli 2014

Zum Abschluss folgender Update :

Ich habe am 14.7. den Defekt an Samsungmemory@hanaro.eu gemeldet. Am gleichen Tag erhielt ich Anweisungen über den Ablauf des Garantieverfahrens. Danach sollte die SSD von DHL bei mir abgeholt werden. Auch die DHL mailte am gleichen Tag Informationen, schon versehen mit einem Paketaufkleber.

Am 15.7. wurde die SSD nach telefonischer Terminabstimmung durch DHL bei mir abgeholt. Den Eingang bestätigte mir Samsung am 17.7.

Schon am 19.7. erhielt ich die SSD (gleiche Serien-Nr.) repariert zurück. Das nenne ich flott.

Ganz toll wäre allerdings noch ein vielleicht ganz kurzer Hinweis darauf, woran meine SSD nun krankte.

Angesichts der Tatsache, daß die SSD nach dem Kauf zunächst 7 Wochen problemlos lief, hoffe ich, daß sie jetzt stabil bleibt. Andernfalls berichte ich.

Gruß H.

[erledigt]Fehler Samsung SSD 840 EVO ?

halo44

Hacker

halo44

Hacker

josef-wien

Ultimate Guru

halo44

Hacker

halo44

Hacker

josef-wien

Ultimate Guru

halo44

Hacker

halo44

Hacker