• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

Rechner "friert ein"

ratibor

Member
Hallo,

gerade habe ich meinen Rechner hochgefahren und er zeigt ein für Linux sehr untypisches Verhalten: er friert ein. Und zwar passierte das ganze, als ich über Firefox ein "video" bei youtube ansehen wollte. Als einziges weiteres Programm lief Dolphin mit meinem /home Verzeichnis. Ein Blick auf den Systemmonitor (der auch erst nach einiger Zeit startete) zeigte Vollauslastung der CPU.

Ein paar Infos zu meinem System:
Code:
Kernel:  Linux 2.6.34.7-0.5-desktop i686
  Distribution:  openSUSE 11.3 (i586)
  KDE:  4.4.4 (KDE 4.4.4) "release 3"

Code:
hwinfo --cpu
01: None 00.0: 10103 CPU                                        
  [Created at cpu.301]
  Unique ID: rdCR.j8NaKXDZtZ6
  Hardware Class: cpu
  Arch: Intel
  Vendor: "GenuineIntel"
  Model: 6.23.10 "Pentium(R) Dual-Core  CPU      E5500  @ 2.80GHz"
  Features: fpu,vme,de,pse,tsc,msr,pae,mce,cx8,apic,sep,mtrr,pge,mca,cmov,pat,pse36,clflush,dts,acpi,mmx,fxsr,sse,sse2,ss,ht,tm,pbe,nx,lm,constant_tsc,arch_perfmon,pebs,bts,aperfmperf,pni,dtes64,monitor,ds_cpl,vmx,est,tm2,ssse3,cx16,xtpr,pdcm,xsave,lahf_lm,tpr_shadow,vnmi,flexpriority
  Clock: 2803 MHz
  BogoMips: 5599.47
  Cache: 2048 kb
  Units/Processor: 2
  Config Status: cfg=no, avail=yes, need=no, active=unknown

02: None 01.0: 10103 CPU
  [Created at cpu.301]
  Unique ID: wkFv.j8NaKXDZtZ6
  Hardware Class: cpu
  Arch: Intel
  Vendor: "GenuineIntel"
  Model: 6.23.10 "Pentium(R) Dual-Core  CPU      E5500  @ 2.80GHz"
  Features: fpu,vme,de,pse,tsc,msr,pae,mce,cx8,apic,sep,mtrr,pge,mca,cmov,pat,pse36,clflush,dts,acpi,mmx,fxsr,sse,sse2,ss,ht,tm,pbe,nx,lm,constant_tsc,arch_perfmon,pebs,bts,aperfmperf,pni,dtes64,monitor,ds_cpl,vmx,est,tm2,ssse3,cx16,xtpr,pdcm,xsave,lahf_lm,tpr_shadow,vnmi,flexpriority
  Clock: 2803 MHz
  BogoMips: 5599.58
  Cache: 2048 kb
  Units/Processor: 2
  Config Status: cfg=no, avail=yes, need=no, active=unknown

Code:
hwinfo --gfxcard
25: PCI 100.0: 0300 VGA compatible controller (VGA)             
  [Created at pci.318]
  Unique ID: VCu0.biBMoUCpU37
  Parent ID: vSkL.BKRVJEm2MDC
  SysFS ID: /devices/pci0000:00/0000:00:01.0/0000:01:00.0
  SysFS BusID: 0000:01:00.0
  Hardware Class: graphics card
  Model: "nVidia GeForce 210"
  Vendor: pci 0x10de "nVidia Corporation"
  Device: pci 0x0a65 "GeForce 210"
  SubVendor: pci 0x1458 "Giga-byte Technology"
  SubDevice: pci 0x34ef 
  Revision: 0xa2
  Driver: "nvidia"
  Driver Modules: "nvidia"
  Memory Range: 0xfd000000-0xfdffffff (rw,non-prefetchable)
  Memory Range: 0xd0000000-0xdfffffff (ro,non-prefetchable)
  Memory Range: 0xce000000-0xcfffffff (ro,non-prefetchable)
  I/O Ports: 0xdc00-0xdc7f (rw)
  Memory Range: 0xfea80000-0xfeafffff (ro,non-prefetchable,disabled)
  IRQ: 16 (138038 events)
  I/O Ports: 0x3c0-0x3df (rw)
  Module Alias: "pci:v000010DEd00000A65sv00001458sd000034EFbc03sc00i00"
  Driver Info #0:
    XFree86 v4 Server Module: nvidia
  Driver Info #1:
    XFree86 v4 Server Module: nvidia
    3D Support: yes
  Config Status: cfg=no, avail=yes, need=no, active=unknown
  Attached to: #10 (PCI bridge)

Primary display adapter: #25


smartctl sagt folgendes:
Code:
=== START OF INFORMATION SECTION ===
Device Model:     SAMSUNG HD502HI
Serial Number:    S1VZJ90S819684
Firmware Version: 1AG01118
User Capacity:    500.107.862.016 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 3b
Local Time is:    Sun Jan  2 22:08:42 2011 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

Da ich selber ein Problem mit der Festplatte vermutete, habe ich über Knoppix (5.1) gebootet und fsck laufen lassen, bei zwei Partitionen gab es kein Problem, bei einer wurde offensichtlich das fs nicht richtig erkannt (vielleicht ist das Knoppix auch schon zu alt, um ext4 zu erkennen?).
Danach habe wieder in Suse gebootet, während des Bootvorgangs wurde auch ein fsck durchgeführt. Was genau das Ergebnis war, konnte ich so schnell nicht sehen und boot.log in /var/log ist leider leer. (vielleicht wird das bootlog inzwischen wo anders abgelegt?)

Genau in diesem Augenblick läuft das System einigermaßen, allerdings geschieht schon das öffnen des K-Menüs nur zeitverzögert.

Vielleicht hat jemand einen Tipp für mich, was ich als nächstes überprüfen kann und muss.
Gruß
Wolfgang
 

lOtz1009

Moderator
Teammitglied
Schau mal nach Auffälligen Einträgen in der /var/log/messages und dmesg.
Auch mal via top schauen welcher Prozess da soviel CPU-Zeit verwendet.
 
OP
R

ratibor

Member
In /var/log/messages gibt es durchaus etwas: und zwar fängt das am 4.12. bereits an

Code:
Dec  4 15:35:12 linux-9xnc smartd[3207]: Device: /dev/sda [SAT], 1 Offline uncorrectable sectors
Dec  4 15:35:12 linux-9xnc smartd[3207]: Device: /dev/sda [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 88 to 85
Dec  4 15:35:12 linux-9xnc smartd[3207]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 87 to 83

Die Meldung wiederholt sich an den folgenden Tagen mit unterschiedlichen Nummern in der eckigen Klammer (kann das der entsprechende Sektor sein?)

Außerdem bin ich auf folgendes gestoßen:
Code:
Device: /dev/sda [SAT], state written to /var/lib/smartmontools/smartd.SAMSUNG_HD502HI-S1VZJ90S819684.ata.state

Die Datei habe ich gefunden, die fängt folgendermaßen an (geändert heute 22:55):
Code:
# smartd state file
self-test-errors = 1
self-test-last-err-hour = 147
ata-smart-attribute.0.id = 1
ata-smart-attribute.0.val = 100
ata-smart-attribute.0.worst = 100
und geht mit unterschiedlichen Attributen so weiter.

in /var/log/messages gibt es für heute um 21:55 folgende Meldung:
Code:
Jan  2 21:55:19 linux-9xnc smartd[3325]: Device: /dev/sda [SAT], previous self-test completed with error (read test element)

Das ganze endet allerdings mit der Botschaft:
Code:
Jan  2 22:55:19 linux-9xnc smartd[3328]: Device: /dev/sda [SAT], previous self-test completed without error

Ein log-file für dmesg habe ich nicht gefunden.

via top ist derzeit wenig zu sehen, die Auslastung des Systems hält sich in der letzten halben Stunde auch in normalen Grenzen. Die Frage ist nur, ob damit schon die Ursache für das Problem behoben ist.
 

josef-wien

Ultimate Guru
ratibor schrieb:
Ein Blick auf den Systemmonitor (der auch erst nach einiger Zeit startete) zeigte Vollauslastung der CPU.
Beim nächsten Mal schau dort oder in der Konsole mit top nach, welche Prozesse das verursachen. Einen Zusammenhang mit dem Festplattenproblem sehe ich aber nicht.

ratibor schrieb:
Ein log-file für dmesg habe ich nicht gefunden.
dmesg ist ein Programm.

ratibor schrieb:
Dec 4 15:35:12 linux-9xnc smartd[3207]: Device: /dev/sda [SAT], 1 Offline uncorrectable sectors
ratibor schrieb:
Jan 2 22:55:19 linux-9xnc smartd[3328]: Device: /dev/sda [SAT], previous self-test completed without error
Offensichtlich ist es der Festplatten-Elektronik gelungen, den Sektor endlich erfolgreich zu lesen, als unbrauchbar kennzuzeichnen und die Daten woanders hinzukopieren. Auch wenn dieser Festplattenfehler nicht unbedingt ein Problem bedeuten muß, solltest Du die Festplatte mit einem Programm des Herstellers oder mit dem Hitachi Drive Fitness Test prüfen.

ratibor schrieb:
vielleicht wird das bootlog inzwischen wo anders abgelegt?
Das war und ist in /var/log/boot.msg zu finden.

ratibor schrieb:
mit unterschiedlichen Nummern in der eckigen Klammer
Das ist die jeweilige Prozeß-Identifikation (pid).
 
OP
R

ratibor

Member
Hat ein paar Tage gedauert, habe aber ein paar neue Beobachtungen:

Das System hängt sich immer noch unregelmäßig auf. Der DFT verlief mit dem Ergebnis: alles in Ordnung (wobei ich nur den Kurztest gemacht habe, zum langen Test sah ich nach dem Ergebnis erst mal keine Veranlassung)

Beim Bootvorgang habe ich die letzten Male folgende Meldung gesehen:
Code:
FATAL: Module ata_piix not found
FATAL: Error running install command for ata_piix
Ich habe dazu bisher nur einen weiteren Foreneintrag gefunden http://www.linuxforen.de/forums/showthread.php?t=265968 Wo gesagt wird: "Diese Meldung kann ignoriert werden." So richtig beruhigt hat mich das allerdings nicht.

Das Aufhängen habe ich weiter beobachtet. Derzeit läuft immer der Systemmonitor im Hintergrund. Nur lässt sich dieser enormen Prozessorauslastung kein Prozess zuordnen. Es gibt immer mal wieder Prozesse die als "inaktiv auf der Festplatte" bezeichnet werden und einen Zombie hatte ich neulich auch.
Meine Beobachtung war, dass sich der Rechner immer dann aufhängt, wenn ich entweder Dateien downloade oder zwischen Verzeichnissen auf der Festplatte hin und her kopiere (z. B. beim Verschieben in den Papierkorb). Die Größe der Dateien scheint dabei keine Rolle zu spielen, oft waren die Dateien nicht größer als ein paar MB.

Was kann ich jetzt noch tun?
 

Jägerschlürfer

Moderator
Teammitglied
ratibor schrieb:
Meine Beobachtung war, dass sich der Rechner immer dann aufhängt, wenn ich entweder Dateien downloade oder zwischen Verzeichnissen auf der Festplatte hin und her kopiere (z. B. beim Verschieben in den Papierkorb). Die Größe der Dateien scheint dabei keine Rolle zu spielen, oft waren die Dateien nicht größer als ein paar MB.
das würde für die fehlerhaften Sektoren auf der Festplatte sprechen. Evtl liegt hier der Fehler,...
 
OP
R

ratibor

Member
und was mache ich nun damit? Hat dieses Hitachiprogramm vielleicht eine Möglichkeit die Sektoren zu reparieren bzw. zu deaktivieren oder gibt es unter Linux da Möglichkeiten. fsck kann doch so was ähnliches auch oder nicht?
 

josef-wien

Ultimate Guru
ratibor schrieb:
So richtig beruhigt hat mich das allerdings nicht.
Um diesen Punkt klarzustellen: Was geben die Befehle
Code:
/sbin/modinfo ata_piix | grep -v alias
grep -i ata_piix /boot/config-2.6.*
grep -i ata_piix /etc/sysconfig/kernel
gzip -cd /boot/initrd | cpio -ivt | grep ata_piix
aus?
 

Ganymed

Guru
Ein Link zum Verständnis von SMART wurde oben schon gegeben.
Schaue Dir die Parameter welche das Ausmappen defekter Bereiche beschreiben und deren möglicherweise steigenden Kennzahlen an.

Im Gegensatz zu Dir sähe ich sehr wohl den Anlass, wenn nicht die Notwendigkeit, den ausführlichen Algorhythmus des DFT anzuwenden.
So ein Test kann bequem über Nacht laufen. Bei 500 GB dauert dieser schon ein paar Stunden.

Gruß Ganymed
 
OP
R

ratibor

Member
Den DFT Test habe ich letzte Nacht laufen lassen: mit dem Ergebnis: 0 (heißt laut Tabelle: keine Fehler).

Dazu noch folgendes:
Code:
/sbin/modinfo ata_piix | grep -v alias
ERROR: modinfo: could not find module ata_piix
linux-9xnc:/home/wolfgang # grep -i ata_piix /boot/config-2.6.*
CONFIG_ATA_PIIX=y
linux-9xnc:/home/wolfgang # grep -i ata_piix /etc/sysconfig/kernel
INITRD_MODULES="thermal ata_piix ata_generic processor fan"
linux-9xnc:/home/wolfgang # gzip -cd /boot/initrd | cpio -ivt | grep ata_piix
42235 blocks

Ich werde jetzt noch mal nach einem Test von Samsung schauen. ansonsten noch mal den Smarttest machen sowie fsck. Jetzt wäre wahrscheinlich auch ein günstiger Zeitpunkt, um sich eine externe FP für eine Datensicherung zuzulegen....
 

josef-wien

Ultimate Guru
ratibor schrieb:
So richtig beruhigt hat mich das allerdings nicht.
Du darfst beruhigt sein, bei Deinem Kernel ist ata_piix im Kernel integriert und nicht als eigenes Modul vorhanden. Trotzdem solltest Du die Eintragung in /etc/sysconfig/kernel belassen (und mit der Fehlermeldung leben), da sich das sehr schnell wieder ändern kann (beim 64 Bit-default-Kernel von 11.3 ist ata_piix ein Modul).

Hast Du den Hauptspeicher schon überprüft?

Was gibt
Code:
smartctl -a /dev/sda
(oder wie immer Deine Platte heißt) aus?
 
OP
R

ratibor

Member
Hallo,

nachdem der Hitachi-Test keinen Fehler gefunden hat, habe ich gedacht, Samsung würde einen ähnlichen Test anbieten, tun sie aber nicht...
Habe mir das neue Knoppix runtergeladen und von dort aus ein fsck auf ausgeführt, der für alle Partitionen ein "clean" ausgegeben hat.

smartctl sagt folgendes:
Code:
smartctl -x /dev/sda
smartctl 5.39.1 2010-01-28 r3054 [i686-pc-linux-gnu] (openSUSE RPM)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     SAMSUNG HD502HI
Serial Number:    S1VZJ90S819684
Firmware Version: 1AG01118
User Capacity:    500.107.862.016 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 3b
Local Time is:    Fri Jan 14 10:27:23 2011 CET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                                        was never started.
                                        Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.
Total time to complete Offline 
data collection:                 (6194) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.                                                                                                                                                                                                     
                                        Supports SMART auto save timer.                                                                                                                                                                                        
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 104) minutes.
Conveyance self-test routine
recommended polling time:        (  12) minutes.
SCT capabilities:              (0x003f) SCT Status supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   100   100   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0007   093   093   011    Pre-fail  Always       -       3190
  4 Start_Stop_Count        0x0032   099   099   000    Old_age   Always       -       591
  5 Reallocated_Sector_Ct   0x0033   100   100   010    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   253   253   051    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0025   100   100   015    Pre-fail  Offline      -       9969
  9 Power_On_Hours          0x0032   100   100   000    Old_age   Always       -       1622
 10 Spin_Retry_Count        0x0033   100   100   051    Pre-fail  Always       -       2
 11 Calibration_Retry_Count 0x0012   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       591
 13 Read_Soft_Error_Rate    0x000e   100   100   000    Old_age   Always       -       0
183 Runtime_Bad_Block       0x0032   100   100   000    Old_age   Always       -       0
184 End-to-End_Error        0x0033   100   100   000    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       1
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   086   073   000    Old_age   Always       -       14 (Lifetime Min/Max 13/14)
194 Temperature_Celsius     0x0022   083   070   000    Old_age   Always       -       17 (Lifetime Min/Max 13/17)
195 Hardware_ECC_Recovered  0x001a   100   100   000    Old_age   Always       -       518781
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   100   100   000    Old_age   Always       -       1
200 Multi_Zone_Error_Rate   0x000a   100   100   000    Old_age   Always       -       0
201 Soft_Read_Error_Rate    0x000a   253   253   000    Old_age   Always       -       0

General Purpose Logging (GPL) feature set supported
General Purpose Log Directory Version 1
SMART           Log Directory Version 1 [multi-sector log support]
GP/S  Log at address 0x00 has    1 sectors [Log Directory]
SMART Log at address 0x01 has    1 sectors [Summary SMART error log]
SMART Log at address 0x02 has    2 sectors [Comprehensive SMART error log]
GP    Log at address 0x03 has    2 sectors [Ext. Comprehensive SMART error log]
GP    Log at address 0x04 has    2 sectors [Device Statistics]
SMART Log at address 0x06 has    1 sectors [SMART self-test log]
GP    Log at address 0x07 has    2 sectors [Extended self-test log]
SMART Log at address 0x09 has    1 sectors [Selective self-test log]
GP    Log at address 0x10 has    1 sectors [NCQ Command Error]
GP    Log at address 0x11 has    1 sectors [SATA Phy Event Counters]
GP    Log at address 0x20 has    2 sectors [Streaming performance log]
GP    Log at address 0x21 has    1 sectors [Write stream error log]
GP    Log at address 0x22 has    1 sectors [Read stream error log]
GP/S  Log at address 0x80 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x81 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x82 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x83 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x84 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x85 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x86 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x87 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x88 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x89 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x8a has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x8b has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x8c has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x8d has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x8e has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x8f has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x90 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x91 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x92 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x93 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x94 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x95 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x96 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x97 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x98 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x99 has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x9a has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x9b has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x9c has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x9d has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x9e has   16 sectors [Host vendor specific log]
GP/S  Log at address 0x9f has   16 sectors [Host vendor specific log]
GP/S  Log at address 0xe0 has    1 sectors [SCT Command/Status]
GP/S  Log at address 0xe1 has    1 sectors [SCT Data Transfer]

SMART Extended Comprehensive Error Log Version: 1 (2 sectors)
Device Error Count: 1
        CR     = Command Register
        FEATR  = Features Register
        COUNT  = Count (was: Sector Count) Register
        LBA_48 = Upper bytes of LBA High/Mid/Low Registers ]  ATA-8
        LH     = LBA High (was: Cylinder High) Register    ]   LBA
        LM     = LBA Mid (was: Cylinder Low) Register      ] Register
        LL     = LBA Low (was: Sector Number) Register     ]
        DV     = Device (was: Device/Head) Register
        DC     = Device Control Register
        ER     = Error register
        ST     = Status register
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 1 [0] occurred at disk power-on lifetime: 1557 hours (64 days + 21 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER -- ST COUNT  LBA_48  LH LM LL DV DC
  -- -- -- == -- == == == -- -- -- -- --
  84 -- 53 01 bf 00 00 19 6b fc 62 e0 00  Error: ICRC, ABRT 447 sectors at LBA = 0x196bfc62 = 426507362

  Commands leading to the command that caused the error were:
  CR FEATR COUNT  LBA_48  LH LM LL DV DC  Powered_Up_Time  Command/Feature_Name
  -- == -- == -- == == == -- -- -- -- --  ---------------  --------------------
  35 00 00 03 dc 00 00 19 6b fa 45 e0 08     00:21:34.390  WRITE DMA EXT
  35 00 00 03 f0 00 00 19 6b f6 32 e0 08     00:21:32.800  WRITE DMA EXT
  35 00 00 03 ee 00 00 19 6b f2 33 e0 08     00:21:31.220  WRITE DMA EXT
  35 00 00 03 f0 00 00 19 6b ee 32 e0 08     00:21:28.830  WRITE DMA EXT
  35 00 00 03 ee 00 00 19 6b ea 33 e0 08     00:21:27.350  WRITE DMA EXT

SMART Extended Self-test Log Version: 1 (2 sectors)
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      1618         -
# 2  Short offline       Completed without error       00%      1558         -
# 3  Extended offline    Completed: read failure       00%       147         906987016
# 4  Short offline       Completed without error       00%       127         -
# 5  Short offline       Completed without error       10%       122         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

SCT Status Version:                  2
SCT Version (vendor specific):       256 (0x0100)
SCT Support Level:                   1
Device State:                        Active (0)
Current Temperature:                 17 Celsius
Power Cycle Max Temperature:         17 Celsius
Lifetime    Max Temperature:         30 Celsius
SCT Temperature History Version:     2
Temperature Sampling Period:         1 minute
Temperature Logging Interval:        1 minute
Min/Max recommended Temperature:     -4/72 Celsius
Min/Max Temperature Limit:           -9/77 Celsius
Temperature History Size (Index):    128 (57)

Index    Estimated Time   Temperature Celsius
  58    2011-01-14 08:20    17  -
 ...    ..( 13 skipped).    ..  -
  72    2011-01-14 08:34    17  -
  73    2011-01-14 08:35    18  -
  74    2011-01-14 08:36    17  -
  75    2011-01-14 08:37    17  -
  76    2011-01-14 08:38    18  -
  77    2011-01-14 08:39    17  -
 ...    ..(  8 skipped).    ..  -
  86    2011-01-14 08:48    17  -
  87    2011-01-14 08:49    18  -
 ...    ..( 12 skipped).    ..  -
 100    2011-01-14 09:02    18  -
 101    2011-01-14 09:03    17  -
 ...    ..( 11 skipped).    ..  -
 113    2011-01-14 09:15    17  -
 114    2011-01-14 09:16    18  -
 115    2011-01-14 09:17    17  -
 116    2011-01-14 09:18    17  -
 117    2011-01-14 09:19    17  -
 118    2011-01-14 09:20    18  -
 119    2011-01-14 09:21    17  -
 ...    ..(  7 skipped).    ..  -
 127    2011-01-14 09:29    17  -
   0    2011-01-14 09:30    18  -
   1    2011-01-14 09:31    17  -
 ...    ..( 28 skipped).    ..  -
  30    2011-01-14 10:00    17  -
  31    2011-01-14 10:01    13  -
  32    2011-01-14 10:02    13  -
  33    2011-01-14 10:03    14  -
  34    2011-01-14 10:04    14  -
  35    2011-01-14 10:05    14  -
  36    2011-01-14 10:06    15  -
 ...    ..(  2 skipped).    ..  -
  39    2011-01-14 10:09    15  -
  40    2011-01-14 10:10    16  -
 ...    ..(  6 skipped).    ..  -
  47    2011-01-14 10:17    16  -
  48    2011-01-14 10:18    17  -
 ...    ..(  8 skipped).    ..  -
  57    2011-01-14 10:27    17  -

SATA Phy Event Counters (GP Log 0x11)
ID      Size     Value  Description
0x000a  2            3  Device-to-host register FISes sent due to a COMRESET
0x0001  2            0  Command failed due to ICRC error
0x0002  2            0  R_ERR response for data FIS
0x0003  2            0  R_ERR response for device-to-host data FIS
0x0004  2            0  R_ERR response for host-to-device data FIS
0x0005  2            0  R_ERR response for non-data FIS
0x0006  2            0  R_ERR response for device-to-host non-data FIS
0x0007  2            0  R_ERR response for host-to-device non-data FIS
0x0008  2            0  Device-to-host non-data FIS retries
0x0009  2            3  Transition from drive PhyRdy to drive PhyNRdy
0x000b  2            0  CRC errors within host-to-device FIS
0x000d  2            0  Non-CRC errors within host-to-device FIS
0x000f  2            0  R_ERR response for host-to-device data FIS, CRC
0x0010  2            0  R_ERR response for host-to-device data FIS, non-CRC
0x0012  2            0  R_ERR response for host-to-device non-data FIS, CRC
0x0013  2            0  R_ERR response for host-to-device non-data FIS, non-CRC

Da in dem Beitrag http://www.linuxforen.de/forums/showthread.php?t=265968 auch von USB-Geräten die Rede war, habe ich jetzt testweise meinen Drucker (einen Oki B4350) ausgesteckt und werde beobachten, ob das eine Auswirkung hat. Obwohl ich zugeben muss, dass laut boot.msg udev problemlos geladen wird. Witzigerweise hat danach das Download von Knoppix problemlos funktioniert.
 

Ganymed

Guru
Samsung bietet die ESTOOLs an.
Das ist ein ISO welches von der davon gebrannten CD startbar ist.

Gruß Ganymed
 
OP
R

ratibor

Member
ESTool habe ich gefunden, werde das gleich mal ausprobieren.

Wenn ich mir im Systemmonitor die Prozessauslastung ansehe, komme ich grob überschlagen in der Regel auf etwa 20-30% trotzdem wird für die beiden Prozessoren Vollauslastung angezeigt.

Seit ich den Drucker nicht mehr dauerhaft angeschlossen habe, habe ich keine Probleme mehr gehabt. Kann mir jemand bestätigen, dass es da einen Zusammenhang geben kann?
Ansonsten fällt mir keine Veränderung ein, die es sein könnte.
 

Ganymed

Guru
Dann fällt mir nichts weiteres ein, als die Beobachtung von top, (evtl auch über STRG + ESC) /var/log/messages, dmesg und /home/username/.xsession-errors.
 
Oben