• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

[gelöst ]Sterbende Platte sdb?

gm2601

Advanced Hacker
Hallo Gurus,

vor ein paar Tagen fing mein 13.2 immer stärker an zu spinnen, zuerst war die Kontrollleiste futsch und nicht wieder zu bekommen, dann kam kdm nicht mehr hoch, sondern nur der Xserver und momentan habe ich den Eindruck das System fährt nur noch im Rescuemode hoch.

Das beinalte Sytem (11.3) auf sda (auch eine 500GB WD) bootet proplemlos, sonst könnte ich hier nicht schreiben.
hwinfo --disk sieht beide Platten fast(!) gleich, fdisk und hdparm sieht nur sda korrekt,:
Code:
Device Files: /dev/sda, /dev/block/8:0, /dev/disk/by-id/ata-WDC_WD5000AADS-00S9B0_WD-WCAV93449369, /dev/disk/by-id/scsi-SATA_WDC_WD5000AADS-_WD-WCAV93449369, /dev/disk/by-path/pci-0000:00:08.0-scsi-0:0:0:0, /dev/disk/by-id/wwn-0x50014ee2043948fd
....
Config Status: cfg=yes, avail=yes, need=no, active=unknown

Device Files: /dev/sdb, /dev/block/8:16, /dev/disk/by-id/ata-_, /dev/disk/by-id/scsi-SATA_WDC_WD5000AADS-_WD-WCAV93470026, /dev/disk/by-path/pci-0000:00:08.0-scsi-1:0:0:0
....
  Drive status: no medium
  Config Status: cfg=new, avail=yes, need=no, active=unknown
null

# hdparm -i /dev/sda

/dev/sda:

 Model=WDC WD5000AADS-00S9B0, FwRev=01.00A01, SerialNo=WD-WCAV93449369
 Config={ HardSect NotMFM HdSw>15uSec SpinMotCtl Fixed DTR>5Mbs FmtGapReq }
 RawCHS=16383/16/63, TrkSize=0, SectSize=0, ECCbytes=50
 BuffType=unknown, BuffSize=unknown, MaxMultSect=16, MultSect=16
 CurCHS=16383/16/63, CurSects=16514064, LBA=yes, LBAsects=976773168
 IORDY=on/off, tPIO={min:120,w/IORDY:120}, tDMA={min:120,rec:120}
 PIO modes:  pio0 pio3 pio4 
 DMA modes:  mdma0 mdma1 mdma2 
 UDMA modes: udma0 udma1 udma2 udma3 udma4 udma5 *udma6 
 AdvancedPM=no WriteCache=enabled
 Drive conforms to: Unspecified:  ATA/ATAPI-1,2,3,4,5,6,7

 * signifies the current active mode
 #  hdparm -i /dev/sdb

/dev/sdb:
 HDIO_DRIVE_CMD(identify) failed: Input/output error
 HDIO_GET_IDENTITY failed: No message of desired type
Ist da noch etwas zu retten, oder Geld für eine neue Platte in die Hand zu nehmen? :(
 

josef-wien

Ultimate Guru
Code:
dmesg | grep -i ata
Als root (falls da noch etwas herauskommt):
Code:
smartctl -a /dev/sdb
Das Kabel steckt auf beiden Seiten noch fest? Ändert ein Tausch der Kabel oder der Anschlüsse am mainboard etwas?
 
OP
gm2601

gm2601

Advanced Hacker
Danke für Deine Antwort!
Unter den 50, die meine Anfrage lasen, bist Du der Primus inter pares. :/

Das Kabel steckt auf beiden Seiten noch fest?
Davon würde ich ausgehen, denn ich habe die Kabel an beide Enden mehrfach ab/angesteckt um einem miesen Kontakt zu entgehen.
Ändert ein Tausch der Kabel oder der Anschlüsse am mainboard etwas?
Letzteres habe ich bewusst vermieden, da ich irgendwann/irgendwo --sorry, ich weiß es nicht mehr genau-- einen Hinweis auf Schwierigkeiten mit Sector 0 bekam und das will ich beim einzigen noch lauffähigen System nicht auch noch riskieren. Ich kann in diesem komischen Rescue-mode/Fail-save mode(?) auch auf die meisten files (auf alle?) von sdb3 (=/home) zugreifen, aber von 11.3 aus komme ich an sdb2 aufgrund des default filesystems von 13.2 nicht ran.

Hier der output der gewünschten Kommandos, ist ein Haufen Holz:
Code:
# dmesg | grep -i ata
[    0.000000]  BIOS-e820: 00000000affa0000 - 00000000affb8000 (ACPI data)
[    0.000000]  modified: 00000000affa0000 - 00000000affb8000 (ACPI data)
[    0.000000] allocate_pgdat: node 0 NODE_DATA f4600000
[    0.000000] Kernel command line: root=/dev/disk/by-id/ata-WDC_WD5000AADS-00S9B0_WD-WCAV93449369-part2 resume=/dev/disk/by-id/ata-WDC_WD5000AADS-00S9B0_WD-WCAV93449369-part1 splash=verbose quiet vga=0x346
[    0.000000]   #2 [0000200000 - 0000af9f64]   TEXT DATA BSS
[    0.000000] Memory: 3826788k/5242880k available (4449k kernel code, 61512k reserved, 3285k data, 432k init, 2985608k highmem)
[    0.000000]       .data : 0xc06586a0 - 0xc098dda8   (3285 kB)
[    0.467781] ACPI: PCI Interrupt Link [LATA] (IRQs 20 21 22 23) *0, disabled.
[    0.468032] libata version 3.00 loaded.
[    1.216989] usbcore: registered new interface driver ums-datafab
[    1.352538] PM: Checking image partition /dev/disk/by-id/ata-WDC_WD5000AADS-00S9B0_WD-WCAV93449369-part1
[    1.353035] Write protecting the kernel read-only data: 2984k
[    1.380726] pata_amd 0000:00:06.0: version 0.4.1
[    1.380759] pata_amd 0000:00:06.0: setting latency timer to 64
[    1.380835] scsi0 : pata_amd
[    1.380918] scsi1 : pata_amd
[    1.381484] ata1: PATA max UDMA/133 cmd 0x1f0 ctl 0x3f6 bmdma 0xffa0 irq 14
[    1.381486] ata2: PATA max UDMA/133 cmd 0x170 ctl 0x376 bmdma 0xffa8 irq 15
[    1.538416] ata1.01: ATAPI: HL-DT-STDVD-RAM GSA-H22N, 1.00, max UDMA/66
[    1.538434] ata1: nv_mode_filter: 0x1f39f&0x1f39f->0x1f39f, BIOS=0x1f000 (0xc50000) ACPI=0x1f01f (900:30:0x14)
[    1.545362] ata1.01: configured for UDMA/66
[    1.548383] ata2: port disabled. ignoring.
[    1.551882] sata_nv 0000:00:08.0: version 3.5
[    1.552214] sata_nv 0000:00:08.0: PCI INT A -> Link[LSA0] -> GSI 21 (level, low) -> IRQ 21
[    1.552245] sata_nv 0000:00:08.0: setting latency timer to 64
[    1.552290] scsi2 : sata_nv
[    1.552337] scsi3 : sata_nv
[    1.552454] ata3: SATA max UDMA/133 cmd 0xe400 ctl 0xe080 bmdma 0xd880 irq 21
[    1.552456] ata4: SATA max UDMA/133 cmd 0xe000 ctl 0xdc00 bmdma 0xd888 irq 21
[    1.552780] sata_nv 0000:00:08.1: PCI INT B -> Link[LSA1] -> GSI 20 (level, low) -> IRQ 20
[    1.552798] sata_nv 0000:00:08.1: setting latency timer to 64
[    1.552831] scsi4 : sata_nv
[    1.552868] scsi5 : sata_nv
[    1.552978] ata5: SATA max UDMA/133 cmd 0xd800 ctl 0xd480 bmdma 0xd000 irq 20
[    1.552980] ata6: SATA max UDMA/133 cmd 0xd400 ctl 0xd080 bmdma 0xd008 irq 20
[    1.865362] ata5: SATA link down (SStatus 0 SControl 300)
[    2.006051] ata3: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[    2.009504] ata3.00: ATA-8: WDC WD5000AADS-00S9B0, 01.00A01, max UDMA/133
[    2.009507] ata3.00: 976773168 sectors, multi 16: LBA48 NCQ (depth 0/32)
[    2.012535] ata3.00: configured for UDMA/133
[    2.012641] scsi 2:0:0:0: Direct-Access     ATA      WDC WD5000AADS-0 01.0 PQ: 0 ANSI: 5
[    2.466055] ata4: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[    2.469295] ata4.00: ATA-8: WDC WD5000AADS-00S9B0, 01.00A01, max UDMA/133
[    2.469298] ata4.00: 976773168 sectors, multi 16: LBA48 NCQ (depth 0/32)
[    2.472311] ata4.00: configured for UDMA/133
[    2.472410] scsi 3:0:0:0: Direct-Access     ATA      WDC WD5000AADS-0 01.0 PQ: 0 ANSI: 5
[    2.785361] ata6: SATA link down (SStatus 0 SControl 300)
[    3.280411] EXT4-fs (sda2): mounted filesystem with ordered data mode
[    4.750107] preloadtrace: systemtap: 1.1/0.147, base: f83c6000, memory: 24data/38text/25ctx/13net/297alloc kb, probes: 34
[    7.929722] EXT4-fs (sda3): mounted filesystem with ordered data mode

# smartctl -a /dev/sdb
smartctl 5.39.1 2010-01-28 r3054 [i686-pc-linux-gnu] (openSUSE RPM)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Caviar Green family
Device Model:     WDC WD5000AADS-00S9B0
Serial Number:    WD-WCAV93470026
Firmware Version: 01.00A01
User Capacity:    500,107,862,016 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   8
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Thu Aug 18 21:51:35 2016 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x84) Offline data collection activity
                                        was suspended by an interrupting command from host.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever 
                                        been run.
Total time to complete Offline 
data collection:                 (10200) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine 
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 120) minutes.
Conveyance self-test routine
recommended polling time:        (   5) minutes.
SCT capabilities:              (0x303f) SCT Status supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   195   144   021    Pre-fail  Always       -       1241
  4 Start_Stop_Count        0x0032   097   097   000    Old_age   Always       -       3815
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   082   082   000    Old_age   Always       -       13808
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3813
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       342
193 Load_Cycle_Count        0x0032   169   169   000    Old_age   Always       -       95457
194 Temperature_Celsius     0x0022   104   092   000    Old_age   Always       -       39
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       2
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       2
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

SMART Error Log Version: 1
ATA Error Count: 73 (device log contains only the most recent five errors)
        CR = Command Register [HEX]
        FR = Features Register [HEX]
        SC = Sector Count Register [HEX]
        SN = Sector Number Register [HEX]
        CL = Cylinder Low Register [HEX]
        CH = Cylinder High Register [HEX]
        DH = Device/Head Register [HEX]
        DC = Device Command Register [HEX]
        ER = Error register [HEX]
        ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 73 occurred at disk power-on lifetime: 10472 hours (436 days + 8 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 20 bd ce 43 e0  Error: UNC 32 sectors at LBA = 0x0043cebd = 4443837

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 20 a0 ce 43 e0 0a      02:03:57.353  READ DMA
  ca 00 08 78 d1 43 e0 0a      02:03:57.352  WRITE DMA
  ca 00 08 70 d1 43 e0 0a      02:03:57.352  WRITE DMA
  ca 00 08 68 d1 43 e0 0a      02:03:57.352  WRITE DMA
  ca 00 08 60 d1 43 e0 0a      02:03:57.352  WRITE DMA

Error 72 occurred at disk power-on lifetime: 10465 hours (436 days + 1 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 6a 64 84 e1  Error: UNC 8 sectors at LBA = 0x0184646a = 25453674

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 68 64 84 e1 0a      00:24:40.731  READ DMA
  ec 00 00 00 00 00 a0 0a      00:24:40.728  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 0a      00:24:40.728  SET FEATURES [Set transfer mode]

Error 71 occurred at disk power-on lifetime: 10465 hours (436 days + 1 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 6a 64 84 e1  Error: UNC 8 sectors at LBA = 0x0184646a = 25453674

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 68 64 84 e1 0a      00:24:38.034  READ DMA
  ec 00 00 00 00 00 a0 0a      00:24:38.030  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 0a      00:24:38.030  SET FEATURES [Set transfer mode]

Error 70 occurred at disk power-on lifetime: 10465 hours (436 days + 1 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 6a 64 84 e1  Error: UNC 8 sectors at LBA = 0x0184646a = 25453674

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 68 64 84 e1 0a      00:24:35.337  READ DMA
  ec 00 00 00 00 00 a0 0a      00:24:35.333  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 0a      00:24:35.333  SET FEATURES [Set transfer mode]

Error 69 occurred at disk power-on lifetime: 10465 hours (436 days + 1 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 6a 64 84 e1  Error: UNC 8 sectors at LBA = 0x0184646a = 25453674

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 68 64 84 e1 0a      00:24:32.639  READ DMA
  ec 00 00 00 00 00 a0 0a      00:24:32.636  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 0a      00:24:32.636  SET FEATURES [Set transfer mode]

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      4432         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Ich habe noch eine Install-DVD von 13.2, einen USB-iso-Stick mit 42.1, habe aber keine Ahnung, ob man damit etwas flicken kann.
Mir wäre die Funktion von 13.2 wichtig, da online Banking bei einer Bank mit dem ollen Fox von 11.3 nicht mehr geht --hatte mit schon überlegt sdb (=13.2) einfach mit 42.1 überzubügeln, aber wenn die Platte spinnt ist das nicht gerade sinnvoll.
 

josef-wien

Ultimate Guru
Das sieht gar nicht so schlecht aus. Seitens des Kernel gibt es keine Probleme. Die Platte selbst hat zwar schon 73 Fehler festgestellt, die letzten 5 liegen aber schon 3.343 Betriebsstunden zurück. Allerdings kann die Platte derzeit 2 Sektoren nicht lesen (was in der Vergangenheit noch nicht vorgekommen ist, da "Reallocated_Sector_Ct" noch auf Null ist). Sie wird es immer wieder versuchen, und wenn sie einmal Erfolg hat, wird sie die Daten in zwei Rerserve-Sektoren verlagern, und es ist wieder alles in Ordnung. Aber solange kannst Du nicht warten. Da nach Deinen Angaben der Failsafe-Start funktioniert, muß zumindest einer der beiden Problem-Sektoren Daten enthalten, die nur beim normalen Start benötigt werden, dort aber unbedingt gebraucht werden.

Ob es eine Möglichkeit gibt, der Platte die logischen Sektor-Nummern des Dateisystems zu entlocken (für die physische Abbildung dieser Sektoren ist ausschließlich die Platte zuständig), entzieht sich meiner Kenntnis.

Aus meiner Sicht kannst Du auf alle Dateien zugreifen mit Ausnahme jener Datei oder jener beiden Dateien, die auf den Problem-Sektoren gespeichert sind. Auf jeden Fall solltest Du die Platte regelmäßig mit smartctl beobachten, um rechtzeitig über einen Austausch nachzudenken. Interessant für mich ist, daß trotz 13.808 Betriebsstunden erst 95.457mal die Köpfe geparkt wurden (meiner "Grünen" habe ich das gleich am Anfang abgewöhnt), da ist noch ausreichend Puffer zu den von WD spezifizierten 300.000 Zyklen.

Wie es weitergeht, muß Du entscheiden. Ich würde die Systempartition formatieren, die Sicherungskopie zurückspielen und den Boot-Manager neu einrichten. Eine Aktualisierung auf 42.1 kann Dein Problem lösen, muß es aber nicht.

P. S. Unabhängig vom Problem stellt sich die Frage, ob Dein BIOS wirklich keine Möglichkeit bietet, SATA-Platten über AHCI anzusprechen?
 
OP
gm2601

gm2601

Advanced Hacker
Danke Josef!

Kann es sein, dass alleine ein "smartctl -a /dev/sdb", der ja, so mein Verständnis, nur den Status abfrägt, den passenden Schubs für die Platte gab?
Heute morgen hat ein fdisk -l beide Platten und ihre Partitionen erkannt, was gestern nicht ums ... klappte.

Momentan läuft "smartctl --test=long /dev/sdb", ich bin also 120 Minuten (bis 10:47) an einem Bootversuch gehindert -- den kurzen Test habe ich erst zu spät entdeckt. :eek:ps:

AHCI hat mit Wiki kurz erklärt, mal sehen ob mein BIOS das erlaubt, der Rechner ist mit 6 Jahren nicht mehr der frischeste, aber bisher war ich je älter das BS je zufriedener.

Ist denn Leap --"a small step for a man a giant leap for mankind??"-- für einen BanalUser überhaupt noch sinnvoll?

*********************************
So, die lange wie die kurze Variante des smartctl-tests sind nun ohne relevante Meldung durchgelaufen, aber am Problem hat sich nichts geändert, ich komme, beim boot von sdb immer noch:
Code:
 4.114661]BTRFS: Failed to read block groups -5 
4.141390]]BTRFS: open_ctree failed
Generating /run/initramfs/rdsosreport.txt
/# init s
failed to start rescue.target: Transaction order ist cyclic. See logs
/.../log/journal# 4ed603cd18304c8d9216b69334cdeb3a
cd 
/# exit
logout
failed to start default.target: Transaction is destructive
...und aus die Maus, nur reboot über die berühmt berüchtigten drei Tasten möglich.

Hätte ich mich nur nicht auf BTRFS eingelassen, dann könnte ich jetzt via 11.3 auf die Dateien in sdb2 zugreifen.
--Ist es möglich und sinnvoll, die 20GB von sdb2 per dd auf eine externe USB-Platte zu kopieren??
--Habe ich eine Chance von der 13-2 Install-DVD einzugreifen, boot area flicken, oder Ähnliches??
 

josef-wien

Ultimate Guru
gm2601 schrieb:
Die Frage hast Du selbst beantwortet:
gm2601 schrieb:
Zu den Fehlermeldungen kann ich nichts sagen, da ich weder btrfs noch systemd (auf dessen Logs man auch von einem anderen (systemd verwendenden) System aus zugreifen kann) verwende.

gm2601 schrieb:
Hätte ich mich nur nicht auf BTRFS eingelassen, dann könnte ich jetzt via 11.3 auf die Dateien in sdb2 zugreifen.
Jedes halbwegs aktuelle Live-System kann mit btrfs umgehen. Im übrigen habe ich Dich so interpretiert, daß der Failsafe-Start ja funktioniert.

gm2601 schrieb:
Ist es möglich und sinnvoll, die 20GB von sdb2 per dd auf eine externe USB-Platte zu kopieren?
Was versprichst Du Dir davon?

gm2601 schrieb:
Habe ich eine Chance von der 13-2 Install-DVD einzugreifen, boot area flicken, oder Ähnliches?
Gegen die defekten Sektoren kannst Du gar nichts machen, das kann nur die Platte selbst.
 
OP
gm2601

gm2601

Advanced Hacker
josef-wien schrieb:
....auf dessen Logs man auch von einem anderen (systemd verwendenden) System aus zugreifen kann).
Leichter gesagt, als getan, von anderen "Linuxen" habe ich noch weniger Ahnung als von SuSe, mir graut schon bei jedem Upgrade.

Im übrigen habe ich Dich so interpretiert, daß der Failsafe-Start ja funktioniert.
Stimmt, das hatte oder hat funktioniert bis zum Prompt, aber wann immer ich zB init jenseits davon probierte war Essig.

Was versprichst Du Dir davon?
Evtl. könnte man nach einem dd auf die erwähnten logs zugreifen und 13.2 mit dem daraus zu ziehenden Honig wieder zum Leben erwecken.

Gegen die defekten Sektoren kannst Du gar nichts machen, das kann nur die Platte selbst.
Ok, die Handhabung der Sparetracks obliegt der Disk alleine, dh. ich habe grob drei Möglichkeiten:
-- versuchen ,mit 13.2 Live oder Install die Partition zu flicken,
-- neue Platte besorgen und damit 13.2 per Inst. zu neuem Leben zu erwecken,
-- oder neue Platte und den Leap zu wagen.
Da meine wichtigsten Daten auch noch unter 11.3 auf sda sind, könnten die beiden zuletzt genannten Jacke wie Hose sein.

Was würde ein Kenner wie Du machen?

PS: Den Begriff "AHCI" habe ich in keinem BIOS-Menü gefunden, vielleicht ist mein 6-jähriges Möhrchen bereits zu alt dafür.
 

josef-wien

Ultimate Guru
gm2601 schrieb:
Evtl. könnte man nach einem dd auf die erwähnten logs zugreifen
Eine Kopie, bei der die defekten Sektoren mit Nullen befüllt werden, nützt Dir genau so viel (oder so wenig) wie die Originaldaten.

gm2601 schrieb:
Was würde ein Kenner wie Du machen?
Das schrieb ich schon. Ohne Sicherungskopie würde ich formatieren und (unter Einbindung der bestehenden Home-Partition) neu installieren.

gm2601 schrieb:
Den Begriff "AHCI" habe ich in keinem BIOS-Menü gefunden
Als root:
Code:
dmidecode -t 0,2
 
OP
gm2601

gm2601

Advanced Hacker
Auch da fand ich nichts von "AHCI". Um sicher zu gehen:
Code:
~ # dmidecode -t 0,2
# dmidecode 2.10
SMBIOS 2.5 present.

Handle 0x0000, DMI type 0, 24 bytes
BIOS Information
        Vendor: American Megatrends Inc.
        Version: 0703   
        Release Date: 03/19/2010
        Address: 0xF0000
        Runtime Size: 64 kB
        ROM Size: 1024 kB
        Characteristics:
                ISA is supported
                PCI is supported
                PNP is supported
                APM is supported
                BIOS is upgradeable
                BIOS shadowing is allowed
                ESCD support is available
                Boot from CD is supported
                Selectable boot is supported
                BIOS ROM is socketed
                EDD is supported
                5.25"/1.2 MB floppy services are supported (int 13h)
                3.5"/720 kB floppy services are supported (int 13h)
                3.5"/2.88 MB floppy services are supported (int 13h)                                                                                                  
                Print screen service is supported (int 5h)                                                                                                            
                8042 keyboard services are supported (int 9h)                                                                                                         
                Serial services are supported (int 14h)                                                                                                               
                Printer services are supported (int 17h)                                                                                                              
                CGA/mono video services are supported (int 10h)                                                                                                       
                ACPI is supported                                                                                                                                     
                USB legacy is supported
                LS-120 boot is supported
                ATAPI Zip drive boot is supported
                BIOS boot specification is supported
                Targeted content distribution is supported
        BIOS Revision: 8.14

Handle 0x0002, DMI type 2, 15 bytes
Base Board Information
        Manufacturer: ASUSTeK Computer INC.
        Product Name: M4N68T-M
        Version: Rev X.0x
        Serial Number: MT7003071803892
        Asset Tag: To Be Filled By O.E.M.
        Features:
                Board is a hosting board
                Board is replaceable
        Location In Chassis: To Be Filled By O.E.M.
        Chassis Handle: 0x0003
        Type: Motherboard
        Contained Object Handles: 0
Ohne Sicherungskopie würde ich formatieren und (unter Einbindung der bestehenden Home-Partition) neu installieren.
Nochmal 13.2 oder gleich Leap, es gibt außer dem aktuellen Fox nichts, was ich bei 13.2 vermissen würde, aber was genau meinst Du mit "unter Einbindung..."?
Home auch formatieren, oder als sdb3 einfach lassen und nur in sdb2 installieren?
 

josef-wien

Ultimate Guru
gm2601 schrieb:
Auch da fand ich nichts von "AHCI".
Ich wollte mainboard und BIOS-Version wissen, aber dieses eher magere BIOS bzw. der Nvidia-Chipsatz scheinen AHCI wirklich nicht zu unterstützen.

gm2601 schrieb:
13.2 oder gleich Leap
Sehr viel Unterschied ist bei der Produktlebensdauer ja nicht vorhanden.

gm2601 schrieb:
Home auch formatieren
Genau das darfst Du nicht machen, Du willst die Daten auf dieser Parltition ja weiterverwenden.

P. S. Für Detailfragen zu openSUSE solltest Du die Suche bemühen und gegebenenfalls ein neues Thema eröffnen, ich verwende diese Distribution seit einem Jahr nicht mehr.
 
OP
gm2601

gm2601

Advanced Hacker
Ok, lassen wir mal AHCI als meine geringste Sorge beiseite.

Vor rund einer halben Stunde brach die Installation von 13.2 nach über 2,5 Stunden mit "fehlgeschlagen" ab, der boot bring nun "No operating system", obwohl in /boot das, was ich als nötig halte enthalten ist. In .../grub2 ist allerdings nur device.map, was mir wenig erscheint. Da ich bei der Inst. für die root-partition ext2 wählte, kann ich nun vom 11.3 auch dort zugreifen. Die home-part. scheint unberührt. :irre:

Im Moment bin ich noch etwas mehr :???: als sonst.
Ohne mein 11.3 wäre ich aufgeschmissen.
Ist es möglich sda (11.3) abzustecken, damit dort garantiert nichts passieren kann, und die andere Platte dann zu installieren, oder habe ich dann zum Schluss zwei sda die sich ins Gehege kommen können?
 

josef-wien

Ultimate Guru
gm2601 schrieb:
der boot bring nun "No operating system"
In .../grub2 ist allerdings nur device.map
Das bedeutet, daß die Installation des Boot-Managers nicht geklappt hat.

Nach Deiner Beschreibung vermute ich, daß Du jeweils im BIOS festlegst, von welcher Platte gestartet werden soll. Dann wollen wir einmal versuchen, ob der Start von 13.2 funktioniert. Starte 11.3, und ergänze dessen Datei /boot/grub/menu.lst um folgenden Block:
Code:
title Linux auf 2. Platte
    root (hd1,1)
    kernel /boot/vmlinuz
    initrd /boot/initrd
Voraussetzung ist natürlich, daß auf der 2. Partition der 13.2-Platte diese Verknüpfungen und die darauf zeigenden Dateien vorhanden sind, was laut
gm2601 schrieb:
in /boot das, was ich als nötig halte
der Fall sein sollte.

gm2601 schrieb:
Da ich bei der Inst. für die root-partition ext2 wählte
Das ist keine sehr glückliche Idee, aber die Erweiterung auf ext3 ist auch nachträglich möglich.

gm2601 schrieb:
zwei sda die sich ins Gehege kommen können?
Der Gerätename (/dev/sdX[Y]) wird bei jedem Systemstart neu festgelegt, daher verwendet man ihn in der Regel nicht, sondern die Geräte-ID, die UUID oder die Volume-Kennung (label).
 
OP
gm2601

gm2601

Advanced Hacker
Hallo Josef,

Das ist keine sehr glückliche Idee, aber die Erweiterung auf ext3 ist auch nachträglich möglich.
Sorry, ich hatte mich getäuscht, es war/ist "ext4". :eek:ps:

Dass der Eintrag in menu.lst auch ohne den Rattenschwanz nach "kernel /boot/vmlinuz" auch funktioniert war mit unbekannt, ist aber angenehm.

Damit kam ich nun bis
Code:
Welcome to openSuse 13.2 "Harlequin" Kernel 3.16.7-35 desktop
linux login:
Komischerweise kam nach einem weiteren boot mehr, aber nach
Code:
OHSI PCI plattform driver
PCI host controller
new USB bus registeres,asigned to bus number2
irq 23, io mem 0xdfffb000
initialized drm 1.1.0 20060810
war "rien ne vas plus".
ALT F7 brachte mich in den emergency mode und dort zeigte "journalctl" in Zeile 770 den ersten Fehler "fsck error 4"
Nach einem manuellen "fsck /dev/sdb2 -y" von 11.3 aus lief der boot bis zum X-login (?) verweigerte mir aber jegliches Passwort - Entfernen des "x" in etc/passwd ließ den boot nicht einmal mehr zum X-login kommen. Was mich auch wunderte, mein Username war in passwd nicht zu finden.

Nun steh ich also wieder im Regen. :???:
 

josef-wien

Ultimate Guru
gm2601 schrieb:
ohne den Rattenschwanz nach "kernel /boot/vmlinuz"
Die Systempartition wird in der initrd festgelegt, und mehr braucht Linux nicht (es sei denn, es sind spezielle - in der Regel hardwareabhängige - Boot-Optionen notwendig).

gm2601 schrieb:
Entfernen des "x" in etc/passwd
Solche Eingriffe sind kontraproduktiv, Du siehst ja, wohin das führt.

gm2601 schrieb:
mein Username war in passwd nicht zu finden
Hast Du während der Installation schon einen normalen Benutzer angelegt? Soweit ich mich erinnere, läuft der Installationsprozeß in zwei Stufen ab, nach der Grundinstallation wird entweder mit kexec in das neu installierte System gewechselt oder der PC neu gestartet. Unter normalen Umständen hätte die Installation dann nach dem Systemstart fortgesetzt werden müssen. auch wenn dabei so wie bei Dir nachgeholfen werden mußte. Ob eine Möglichkeit besteht, das jetzt zu erzwingen, kann ich Dir nicht sagen.
 
OP
gm2601

gm2601

Advanced Hacker
Hallo Josef,

ja, ich hatte einen User angelegt und die Frage "password auch für root verwenden" (oder so ähnlich) bejaht, die Tastatur war auch auf deutsch eingestellt und der angebotene Tastaturtest zeigte auch mein Passwort korrekt an.

Beides, ein erneuter Versuch der jeweils nackten, also ohne online Repos, von 13.2 von der DVD, wie auch von Leap 42.1 vom USB-Stick schlugen fehl -- von USB ging es nur etwas schneller- :down:

Im Moment bin ich dicke bedient, morgen besorge ich mir einen neue Platte, vielleicht wäre auch ein neuer Rechner sinnvoll. Ein dreifach Hoch auf ein uraltes System!!

Eine Frage noch:
Braucht "openSUSE-Leap-42.1-DVD-x86_64.iso" wirklich eine spezielle Utility um auf einen USB-Stick übertragen zu werden, oder genügt ein dd? Der Rechner bootet ja von USB, fängt auch die Inst vernünftig an, aber auf die Frage "installiertes System booten" kommt "no sytem found" :nosmile:
 

tomm.fa

Administrator
Teammitglied
gm2601 schrieb:
Eine Frage noch:
Braucht "openSUSE-Leap-42.1-DVD-x86_64.iso" wirklich eine spezielle Utility um auf einen USB-Stick übertragen zu werden, oder genügt ein dd?
Ich hatte bisher nur dd dazu verwendet.
 
OP
gm2601

gm2601

Advanced Hacker
Code:
dd if=openSUSE-Leap-42.1-DVD-x86_64.iso of=/dev/sdc bs=512k
So, oder empfiehlt es sich "bs" beim default 512 Bytes zu lassen?
 

josef-wien

Ultimate Guru
Damit verlagerst Du nur einen eventuell fehlerhaften Bereich geringfügig. Entferne ein Modul und teste das andere ein Nacht mit memtest. Danach kommt das zweite Modul (ebenfalls allein) an die Reihe.
 
Oben