• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

[gelöst] Probleme nach Stromausfall mit SSD Platte

Punki

Member
Hi zusammen,

nach einem Strom-Ausfall im Urlaub in Spanien habe ich mit meinem Laptop Probleme mit der Start Sequenz.

Folgende Meldungen

Oct 15 22:34:17 pc000100 kernel: [ 223.352148] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6
Oct 15 22:34:17 pc000100 kernel: [ 223.352151] ata1.00: BMDMA stat 0x26
Oct 15 22:34:17 pc000100 kernel: [ 223.352155] ata1.00: failed command: READ DMA EXT
Oct 15 22:34:17 pc000100 kernel: [ 223.352162] ata1.00: cmd 25/00:00:20:ab:c1/00:08:03:00:00/e0 tag 0 dma 1048576 in
Oct 15 22:34:17 pc000100 kernel: [ 223.352163] res 51/84:00:20:ab:c1/84:08:03:00:00/e0 Emask 0x30 (host bus error)
Oct 15 22:34:17 pc000100 kernel: [ 223.352165] ata1.00: status: { DRDY ERR }
Oct 15 22:34:17 pc000100 kernel: [ 223.352167] ata1.00: error: { ICRC ABRT }
Oct 15 22:34:17 pc000100 kernel: [ 223.352179] ata1: soft resetting link
Oct 15 22:34:17 pc000100 kernel: [ 223.596342] ata1.00: configured for UDMA/33
Oct 15 22:34:17 pc000100 kernel: [ 223.596355] ata1: EH complete
Oct 15 22:34:17 pc000100 kernel: [ 223.600225] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6
Oct 15 22:34:17 pc000100 kernel: [ 223.607953] ata1.00: BMDMA stat 0x26
Oct 15 22:34:17 pc000100 kernel: [ 223.615352] ata1.00: failed command: READ DMA EXT
Oct 15 22:34:17 pc000100 kernel: [ 223.622721] ata1.00: cmd 25/00:00:20:ab:c1/00:08:03:00:00/e0 tag 0 dma 1048576 in
Oct 15 22:34:17 pc000100 kernel: [ 223.622723] res 51/84:00:20:ab:c1/84:08:03:00:00/e0 Emask 0x30 (host bus error)
Oct 15 22:34:17 pc000100 kernel: [ 223.637671] ata1.00: status: { DRDY ERR }
Oct 15 22:34:17 pc000100 kernel: [ 223.645128] ata1.00: error: { ICRC ABRT }
Oct 15 22:34:17 pc000100 kernel: [ 223.652507] ata1: soft resetting link
Oct 15 22:34:17 pc000100 kernel: [ 223.896343] ata1.00: configured for UDMA/33
Oct 15 22:34:17 pc000100 kernel: [ 223.896352] ata1: EH complete
Oct 15 22:34:17 pc000100 kernel: [ 223.917449] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6
Oct 15 22:34:17 pc000100 kernel: [ 223.925225] ata1.00: BMDMA stat 0x26
Oct 15 22:34:17 pc000100 kernel: [ 223.932637] ata1.00: failed command: READ DMA EXT
Oct 15 22:34:17 pc000100 kernel: [ 223.940020] ata1.00: cmd 25/00:00:20:b3:c1/00:08:03:00:00/e0 tag 0 dma 1048576 in
Oct 15 22:34:17 pc000100 kernel: [ 223.940022] res 51/84:00:20:b3:c1/84:08:03:00:00/e0 Emask 0x30 (host bus error)
Oct 15 22:34:17 pc000100 kernel: [ 223.954978] ata1.00: status: { DRDY ERR }
Oct 15 22:34:17 pc000100 kernel: [ 223.962440] ata1.00: error: { ICRC ABRT }
Oct 15 22:34:17 pc000100 kernel: [ 223.969827] ata1: soft resetting link
Oct 15 22:34:17 pc000100 kernel: [ 224.212341] ata1.00: configured for UDMA/33
Oct 15 22:34:17 pc000100 kernel: [ 224.212351] ata1: EH complete
Oct 15 22:34:17 pc000100 kernel: [ 224.216660] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6
Oct 15 22:34:17 pc000100 kernel: [ 224.224327] ata1.00: BMDMA stat 0x26

verzögern den Start um einige Zeit (ca. 10 Minuten). Bei einer SSD-Platte hat das bislang 20 Sekunden gedauert.
Ich habe nur einen Ausschnitt der Meldungen eingefügt, da diese Nachrichten geschätzt ca. 1000 Stück vorkommen.

Nach einer Weile 'arbeit' mit dem Rechner fällt mir auf, dass eigentlich alle Aktionen länger als sonst dauern... und habe das
Log (/var/log/messages) kontrolliert und siehe da, die Meldungen ...

Oct 15 23:12:39 pc000100 kernel: [ 2555.941693] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6
Oct 15 23:12:39 pc000100 kernel: [ 2555.941700] ata1.00: BMDMA stat 0x26
Oct 15 23:12:39 pc000100 kernel: [ 2555.941707] ata1.00: failed command: READ DMA EXT
Oct 15 23:12:39 pc000100 kernel: [ 2555.941724] ata1.00: cmd 25/00:00:88:46:d6/00:02:07:00:00/e0 tag 0 dma 262144 in
Oct 15 23:12:39 pc000100 kernel: [ 2555.941728] res 51/Oct 15 23:12:39 pc000100 kernel: [ 2555.763436] ata1: soft resetting link
Oct 15 23:12:39 pc000100 kernel: [ 2555.940442] ata1.00: configured for UDMA/33
Oct 15 23:12:39 pc000100 kernel: [ 2555.940462] ata1: EH complete
Oct 15 23:12:39 pc000100 kernel: [ 2555.941693] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6
Oct 15 23:12:39 pc000100 kernel: [ 2555.941700] ata1.00: BMDMA stat 0x26
Oct 15 23:12:39 pc000100 kernel: [ 2555.941707] ata1.00: failed command: READ DMA EXT
Oct 15 23:12:39 pc000100 kernel: [ 2555.941724] ata1.00: cmd 25/00:00:88:46:d6/00:02:07:00:00/e0 tag 0 dma 262144 in
Oct 15 23:12:39 pc000100 kernel: [ 2555.941728] res 51/84:00:88:46:d6/84:02:07:00:00/e0 Emask 0x30 (host bus error)
Oct 15 23:12:39 pc000100 kernel: [ 2555.941735] ata1.00: status: { DRDY ERR }
Oct 15 23:12:39 pc000100 kernel: [ 2555.941741] ata1.00: error: { ICRC ABRT }
Oct 15 23:12:39 pc000100 kernel: [ 2555.941757] ata1: soft resetting link
Oct 15 23:12:40 pc000100 kernel: [ 2556.120256] ata1.00: configured for UDMA/33
Oct 15 23:12:40 pc000100 kernel: [ 2556.120274] ata1: EH complete
Oct 15 23:12:40 pc000100 kernel: [ 2556.130363] ata1.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6
Oct 15 23:12:40 pc000100 kernel: [ 2556.130367] ata1.00: BMDMA stat 0x26
Oct 15 23:12:40 pc000100 kernel: [ 2556.130371] ata1.00: failed command: READ DMA EXT
Oct 15 23:12:40 pc000100 kernel: [ 2556.130378] ata1.00: cmd 25/00:00:88:4c:d6/00:04:07:00:00/e0 tag 0 dma 524288 in
Oct 15 23:12:40 pc000100 kernel: [ 2556.130379] res 51/84:00:88:4c:d6/84:04:07:00:00/e0 Emask 0x30 (host bus error)
Oct 15 23:12:40 pc000100 kernel: [ 2556.130382] ata1.00: status: { DRDY ERR }
Oct 15 23:12:40 pc000100 kernel: [ 2556.130384] ata1.00: error: { ICRC ABRT }
Oct 15 23:12:40 pc000100 kernel: [ 2556.130396] ata1: soft resetting link
Oct 15 23:12:40 pc000100 kernel: [ 2556.308411] ata1.00: configured for UDMA/33
Oct 15 23:12:40 pc000100 kernel: [ 2556.308434] ata1: EH complete

erscheinen die ganze Zeit.

Besagt das, dass die Platte kaputt ist??? Was könnte ich den machen???

Ab und an hängt sich der Rechner auf. Dabei habe ich noch keine Regelmäßigkeit erkannt.

Habt ihr eine Idee wie ich das Problem in den Griff bekommen kann?

Gruß

Punki
 
OP
P

Punki

Member
Hi zusammen,

folgende Ausgabe bei smartctl -a /dev/sda:


Code:
pc000100:~ # smartctl -a /dev/sda
smartctl 5.39.1 2010-01-28 r3054 [i686-pc-linux-gnu] (openSUSE RPM)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     Corsair CSSD-V128GB2
Serial Number:    10476533000010220504
Firmware Version: 2.2
User Capacity:    128,035,676,160 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Tue Oct 16 10:27:16 2012 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.
Total time to complete Offline 
data collection:                 (   0) seconds.
Offline data collection
capabilities:                    (0x1d) SMART execute Offline immediate.
                                        No Auto Offline data collection support.
                                        Abort Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        No Conveyance Self-test supported.                                                                                                                                                                   
                                        No Selective Self-test supported.                                                                                                                                                                    
SMART capabilities:            (0x0003) Saves SMART data before entering                                                                                                                                                                     
                                        power-saving mode.                                                                                                                                                                                   
                                        Supports SMART auto save timer.                                                                                                                                                                      
Error logging capability:        (0x00) Error logging NOT supported.                                                                                                                                                                         
                                        General Purpose Logging supported.                                                                                                                                                                   
Short self-test routine                                                                                                                                                                                                                      
recommended polling time:        (   0) minutes.                                                                                                                                                                                             
Extended self-test routine                                                                                                                                                                                                                   
recommended polling time:        (   0) minutes.                                                                                                                                                                                             
                                                                                                                                                                                                                                             
SMART Attributes Data Structure revision number: 16                                                                                                                                                                                          
Vendor Specific SMART Attributes with Thresholds:                                                                                                                                                                                            
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE                                                                                                                                             
  1 Raw_Read_Error_Rate     0x0000   006   000   000    Old_age   Offline      -       0                                                                                                                                                     
  9 Power_On_Hours          0x0000   156   000   000    Old_age   Offline      -       0                                                                                                                                                     
 12 Power_Cycle_Count       0x0000   248   001   000    Old_age   Offline      -       0                                                                                                                                                     
184 End-to-End_Error        0x0000   054   000   000    Old_age   Offline      -       0                                                                                                                                                     
195 Hardware_ECC_Recovered  0x0000   000   000   000    Old_age   Offline      -       0                                                                                                                                                     
196 Reallocated_Event_Count 0x0000   000   000   000    Old_age   Offline      -       0                                                                                                                                                     
197 Current_Pending_Sector  0x0000   000   000   000    Old_age   Offline      -       0                                                                                                                                                     
198 Offline_Uncorrectable   0x0000   062   220   000    Old_age   Offline      -       17240                                                                                                                                                 
199 UDMA_CRC_Error_Count    0x0000   074   016   000    Old_age   Offline      -       20100                                                                                                                                                 
200 Multi_Zone_Error_Rate   0x0000   247   158   000    Old_age   Offline      -       216                                                                                                                                                   
201 Soft_Read_Error_Rate    0x0000   200   249   000    Old_age   Offline      -       239                                                                                                                                                   
202 Data_Address_Mark_Errs  0x0000   018   085   000    Old_age   Offline      -       25                                                                                                                                                    
203 Run_Out_Cancel          0x0000   230   040   000    Old_age   Offline      -       24                                                                                                                                                    
204 Soft_ECC_Correction     0x0000   000   000   000    Old_age   Offline      -       0                                                                                                                                                     
205 Thermal_Asperity_Rate   0x0000   136   019   000    Old_age   Offline      -       0                                                                                                                                                     
206 Flying_Height           0x0000   001   000   000    Old_age   Offline      -       0                                                                                                                                                     
207 Spin_High_Current       0x0000   195   001   000    Old_age   Offline      -       0                                                                                                                                                     
208 Spin_Buzz               0x0000   129   000   000    Old_age   Offline      -       0
209 Offline_Seek_Performnce 0x0000   098   000   000    Old_age   Offline      -       0
211 Unknown_Attribute       0x0000   000   000   000    Old_age   Offline      -       0
212 Unknown_Attribute       0x0000   050   017   000    Old_age   Offline      -       0
213 Unknown_Attribute       0x0000   000   000   000    Old_age   Offline      -       0

Warning: device does not support Error Logging
Warning! SMART ATA Error Log Structure error: invalid SMART checksum.
SMART Error Log Version: 1
No Errors Logged

Warning! SMART Self-Test Log Structure error: invalid SMART checksum.
SMART Self-test log structure revision number 1
No self-tests have been logged.  [To run self-tests, use: smartctl -t]


Device does not support Selective Self Tests/Logging
pc000100:~ #

Hab ich irgend eine Möglichkeit was zu testen/machen???

Mir fällt da ein, es handelt sich um openSUSE 11.3.

Gruß

Punki
 

josef-wien

Ultimate Guru
Punki schrieb:
198 Offline_Uncorrectable 0x0000 062 220 000 Old_age Offline - 17240
199 UDMA_CRC_Error_Count 0x0000 074 016 000 Old_age Offline - 20100
200 Multi_Zone_Error_Rate 0x0000 247 158 000 Old_age Offline - 216
201 Soft_Read_Error_Rate 0x0000 200 249 000 Old_age Offline - 239
202 Data_Address_Mark_Errs 0x0000 018 085 000 Old_age Offline - 25
203 Run_Out_Cancel 0x0000 230 040 000 Old_age Offline - 24
Wenn Deine SSD die Wahrheit sagt, hat sie 17240 nicht korrigierbare Fehler, Du solltest sie schleunigst austauschen.
 

abyss

Member
UDMA-Fehler deuten auf Verbindungsprobleme zwischen Platte und Pc hin.
Bevor Du die Platte austauschst, kontrolliere mal den Connector bzw. das Kabel mit dem die SSD mit dem Notebook verbunden ist
Ich hatte einmal aehnliche Fehlermeldungen von einer Platte und es lag am Verbindungskabel.
 
OP
P

Punki

Member
Hi zusammen,

also die SSD-Platte habe ich (wieder erwarten) ans laufen gebracht. Damit hatte ich
dann die Möglichkeit die Daten zu kopieren.
Nun habe ich eine 'stink normale' Laptop-Platte drinnen Windows und openSUSE
wieder installiert und soweit funktioniert der Rechner auch. LEIDER klappt
das Ausschalten nicht. Dafür mache ich aber einen neuen Thread auf.

Vielen Dank für eure Hilfe.

Gruß

Punki
 
Oben