• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

Nach Update RAID1: "Could not find /dev/md1" "invalid root"

daiml

Member
Hallo liebe Forumianer,

ich brauche wieder einmal dringend Eure Hilfe.
Ich sitze wieder einmal vor meinem "streikenden" Linux-Server ...
Auf dem Server ist openSuse 11.1 mit -5- RAID1-Arrays installiert und am Mittwoch Abend wurde ein automatisches Update ausgeführt. Seit dem danach folgenden Neustart, zu dem ich aufgefordert worden bin, bliebt der Rechner wieder im Bootvorgang stecken.

Ich hatte ein ähnliches Problem bereits schon im Januar, als ich ein Update von Suse 10.2 auf openSuse 11.1 durchführen wollte (http://www.linux-club.de/search.php?t=100734) ... nur dass es diesmal offenbar (zumindest bisher) keine Lösung für diese Fehlermeldung gibt.

Ich habe bereits schon die gesamten Goggle- und sonstige Suchmaschinen-Datenbestände nach halbwegs brauchbaren Lösungsvorschlägen durchsucht ...
... jedoch bisher erfolglos :nosmile:

Zur Hardware:
Code:
      MainBoard: ASRock In K7VT6 motherboard
      CPU: AMD Athlon(tm) XP 2600+ (~2 GHz)
      SCSI-Controller (PCI) Adaptec "AHA-2940/2940W / AIC-7871" mit
      - TEAC CD ROM 532
      - IOMEGA ZIP 100 (/dev/sdb)
      - Quantum Quantum VP32210 (2 GByte für SWAP)  (/dev/sda)
      Festplatten: 3 * IDE
      - 2 baugleiche SEAGATE ST3250623A mit je 250 GByte  (/dev/sdc &  (/dev/sdd))
      mit 5 * RAID1
      - 1 SEAGATE ST3400832A mit je 400 GByte als Backup-Medium  (/dev/sde)
      - 1 DVD-Brenner (Samsung, IDE)

Auf den beiden baugleichen IDE-Festplatte (je 250 GByte) ist eine RAID1-Struktur angelegt:

Code:
      md0 = sdc1, sdd1 = 100 MByte = /boot
      md1 = sdc2, sdd2 = 15 GByte = /
      md2 = sdc3, sdd3 = 10 GByte = /var
      md3 = sdc5, sdd5 = 50 GByte = /home
      md4 = sdc6, sdd6 = 157 GByte = /share (für file-server)
Die Struktur hat auch - mit Ausnahme des Boothängers, den ich im vorigen Thread (s.o.) schon beschrieben hatte - funktioniert. Postfix und Samba taten Ihre Dienste; wenngleich Samba mit Version 11.1 sich recht zickig verhält.

Die Ausgaben beim Bootvorgang sehen aus, wie folgt:

Code:
Waiting for device /dev/md1 to appear: ................ Could not find /dev/md1.
Want mre to fall back to /dev/md1? (Y/n) 
y
Waiting for device /dev/md1 to appear: ................ not found -- exiting to /bin/sh
$

Want me to fall back to /dev/md1? (Y/n) 
n
not found -- exiting to /bin/sh
$
invalid root filesystem -- exiting to /bin/sh
$ grub
sh: grub: command not found
$ Strg+D
$ exit
No init found. Try passing init= option to the kernel.
umount: /dev/pts: device is busy.
		(In some cases useful info about processes that use
		 the device is found by Isof(8) or fuser(1))
umount: /dev: device is busy.
		(In some cases useful info about processes that use
		 the device is found by Isof(8) or fuser(1))
Kernel panic - not syncing: Attemped to kill init!
_

Danach bleibt der Cursor stehen, die Tastatur-LED für Shift und Roll blinken synchron und Tastatureingaben werden nicht mehr angenommen (auch nicht Ctrl-Alt-DEL).

Ich habe bereits schon von der openSuse 11.1 DVD gebootet und versucht, eine Reparatur durchzuführen.
Die Yast2-Reparatur hat festgestellt, dass die beiden ROOT-Partitionen (sdc2, sdd2) fehlerhafte Einträge im Dateiverzeichnis enthielten:

Die folgenden Ausgaben gelten auch für den Spiegel auf '/dev/sdd2':
"Das Dateisystem 'Ext3' von Partition '/dev/sdc2' ist beschädigt ... Reparieren"
Code:
/dev/sdc2: Duplicate or bad block in use
/dev/sdc2: Multiply-claimed blocks in inode 860293:3461120
/dev/sdc2: Multiply-claimed blocks in inode 860622:3461120
               (There are 2 inodes containing multiply-claimed blocks)
/dev/sdc2: File /lib/mkinitrd/scripts/boot-md.sh (inode 860293:3461120) has 1 multiply-claimed block(s), 
                shared with 1 file(s):
/dev/sdc2: /lib/libnss_winbind.so.2 (inode 860622:3461120) 
/dev/sdc2: UNEXPECTED INCONSISTENCY; RUN fsck MANUALLY.
Ich habe dann von der Knoppix DVD (5.3.1) gestartet und fsck ausgeführt.
fsck konnte auf beiden Partitionen die Fehler beheben. Nunmehr sind alle Partitionen "clean" - das meldete bei einem weiteren Reparatur-Versuch mittels der openSuse-DVD auch Yast2 ...
...allerdings meldet Yast2 bei diesem Reparatur-Versuche auch:
Keine gültige Root-Partition gefunden
... höchstwahrscheinlich ist kein gültiges Linux-System vorhanden ..."

Na - kann man noch mehr Glück haben :x

Ich hatte dann auch schon versucht mit der Boot-Option "hwprobe=-modules.pata" (http://www.heise.de/open/OpenSuse-10-3-Erster-Test--/artikel/96900/1) zu starten. Ich könnt Euch das Ergebnis sicherlich denken ... derselbe Sch... :zensur:
Von Yast2 wird mir nur noch eine Neuinstallation angeboten. :schockiert:
Gibt´s denn keine andere Lösung ??? :???:

lG an Alle, daiml
 
A

Anonymous

Gast
sieht mir fast so aus als ob die Updateprozedur die menu.lst verbogen hat. Schau mal nach ob da noch eine automatisch erstellte Sicherungskopie rumliegt, und vergleich die beiden mal.
http://www.linupedia.org/opensuse/SuSE_und_Grub#Was_YaST_nicht_versteht_wird_gnadenlos_umkonfiguriert
wann Yast in der Grubkonfiguration herumfuhrwerkt
....
Beim installieren bestimmter Pakete, ua. beim Kernelupdate, installieren/deinstallieren von zusätzlichen Kernel, oder bestimmten Programmen die einen speziell konfigurierten Kernel mitbringen, bei ehr seltenen Updates von grub oder initrd, Bei einem kompletten Systemupdate, Im Zweifelsfall immer, wenn zur Aktivierung ein Reboot notwendig ist.
......

Da du jetzt allerdings schon am den Raideinzelteilen rumgespielt hast, würde ich dir empfehlen erstmal von CD aus die 2. Hälfte der Spiegel auf defekt zu setzen. Nicht das es dann noch Probleme gibt weil beide Spiegelhälften der Meinung sind, sie sind online aber der Inhalt der beiden Spiegelhälften nicht 100% identisch sind, vor allen in den Verwaltungsblöcken der Filesysteme kann das unberechenbare Auswirkungen mit sich bringen.

robi
 
OP
D

daiml

Member
Hallo Robi,

danke für die schnelle Antwort.
Ich werde das mal gleich checken und melde mich dann.

Gruß, daiml
 
OP
D

daiml

Member
... also die 'menu.lst' ist mit dem Backup vom Januar identisch.
Daran liegt´s wohl nicht.

Ich habe die zweite Platte einfach abgeklemmt und gestartet ...
... mit demselben Ergebnis
 
Wenn Du das System startest, kommst Du dann noch in das Grubmenü? Dann kannst Du normalerweise mit der c Taste eine grub-shell aufrufen. In dieser gibst Du mal
Code:
find /boot/vmlinuz
ein und drückst Enter. Mit ein bißchen Glück findet grub dann einen Kernel. Weiteres findest Du hier
 
A

Anonymous

Gast
Wenn oben das auch nicht klappt, dann hier weiterlesen:

/dev/sdc2: Multiply-claimed blocks in inode 860622:3461120
(There are 2 inodes containing multiply-claimed blocks)
/dev/sdc2: File /lib/mkinitrd/scripts/boot-md.sh (inode 860293:3461120) has 1 multiply-claimed block(s),
shared with 1 file(s):
Es ist natürlich auch irgendwie auffällig das da ausgerechnet eine Datei kaputt gewesen ist, die wohl mit dem erstellen der initrd für das booten von Raid zu tun haben könnte, ( kann das nicht nachvollziehen, diese Datei gibt es auf meinem System nicht.)

Bleibt dir wohl im Zweifelsfall weiter nichts übrig als die ganze Bootkonfiguration nochmal von Hand selbst aufsetzten.
- Von CD booten.
- Alle Raid aktivieren
- Das Root-Raid mounten
- Alle anderen Raids dort an die richtige Stelle einhängen.
- /proc und /sys /dev dort in dieses rootfilesystem einhängen
- mit chmod in das Filesystem wechseln
- die initrd neu erstellen
- den bootloader per Hand (am besten aus der Grubshell heraus) neu für Raid installieren

Haufen Arbeit. Einiges wirst du hier irgendwo finden http://www.linupedia.org/opensuse/Backupkonzept#Austausch_eines_laufenden_LINUX das andere hier http://www.linupedia.org/opensuse/NonRaid_zu_(software)Raid1_SuSE_10_1 (eventuell wird der Link im Forum nicht sauber angezeigt)

Achtung beim erstellen der initrd gab es wohl einige Änderungen innerhalb der Versionen, und genau dort scheint eventuell auch was an deinem Filesystem defekt gewesen zu sein, also hier kann es differenzen zu den Howtos geben oder Probleme bei dir auftreten. Eventuell musst du das Paket nochmal aktualisieren.

robi
 
OP
D

daiml

Member
Hallo Robi,

vielen, vielen dank für die Mühe, die Du Dir gemacht hast.

Ich habe mich durch Deine Tips gearbeitet - aber es wurde eher schlimmer als besser.
Schließlich musste ich feststellen, dass die Howtos doch schon recht weit von der Version 11.1 abgewichen sind.
Also habe ich eben die Gelegenheit beim Schopfe gepackt, mich der Empfehlung von Suse gebuegt, und das System doch neu aufgesetzt.
Bei der Gelegenheit habe ich aus meinem RAID1-Verbund auch gleich ein RAID5 gemacht.
Die Partition /boot befindet sich nun nicht mehr in einem RAID-Verbund ... da klappt das Booten einwandfrei.
Es erscheint zwar immernoch der kleine Hänger beim Booten - aber das nehme ich momentan noch als "Schönheitsfehler" hin.

Derzeit werden gerade die Backups zurück gespielt und es scheint alles zu funktionieren ...
... aber ich habe die Updates ja noch vor mir :skeptisch:
Ich hoffe, dass sich mit dem letzten Update nicht wieder so ein Debakel zusammen braut.

Danke & Gruß daiml
 
Oben