• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

[teilweise gelöst] Fehler in SW RAID 5

A

Anonymous

Gast
Hi,

ich habe ein Problem mit einem Software RAID 5. Folgende Konfiguration:

MoBo: Asus A7N8X-X, Sempron 2800, 1GB Memory
SATA-Controller: DC-4300 RAID, RAID-Funktion nicht benutzt, nur als 4fach SATA-Controller.
80 GB IDE, nur für OS
4 x Samsung 103UJ, SW-RAID 5, ext3
OpenSuSE 11.0 mit allen Updates, identische Probleme mit OpenSuSE 10.3

beim ersten Versuch habe ich das RAID 5 über Yast aufgesetzt. Es lief nicht besonders gut, in unregelmäßigen Abständen wurde auf einer der RAID-Platten (nicht immer der gleichen) ein deutlich hörbarer Reset ausgelöst, was jedesmal zu einem Resync des RAID führte. Nachdem ich dem smartd den Zugriff auf die Platten entzog, war das Problem weg. Allerdings trat hier ein Phänomen auf: wenn das System während des Resync des RAID rebootet wurde, zeigte "cat /proc/mdstat" nach dem Neustart den resync als beendet obwohl er noch gar nicht fertig sein konnte. Die Daten waren zum großen Teil natürlich im Eimer.


beim zweiten Versuch hatte ich auf einer der Samsung 103UJ Daten in einer NTFS Partition. Also habe ich das RAID 5 mit mdadm und einer Platte als "missing" aufgesetzt. Als die Daten von der NTFS-Platte ins RAID kopiert waren, habe ich auf der Platte eine RAID-Partition angelegt und sie mit mdadm dem RAID hinzugefügt. Der resync begann und ich habe während des resync noch weitere Daten ins RAID kopiert. Nachdem der resync fertig war habe ich den Rechner neu gebootet. Während des reboot wurde die ext3-Partition auf dem RAID als defekt angezeigt und der automatische fsck lief an. Der brach aber nach kurzer Zeit ab und ich mußte ihn von Hand starten. Es wurde eine sehr große Anzahl von inodes als fehlerhaft bereinigt.


Ich habe das gleiche auf einem anderen System ausprobiert. Dort habe ich ein SW RAID 5 auf 4 Partitionen angelegt und all das durchgezogen, was ich oben beschrieben habe. Dort lief alles ohne Schwierigkeiten und fehlerfrei ab. Auch der Status eines resync blieb über den reboot erhalten.


Ich weiß nicht mehr so richtig, wo ich weitersuchen soll. Ich traue dem RAID 5 nicht mehr, dabei sollte es gerade zur Datensicherung dienen. Vielleicht hat irgendjemand von euch eine Idee dazu.


Grüße
 
OP
A

Anonymous

Gast
Hi,

es war wohl zum größten Teil ein Hardwareproblem. Ich habe das Mainboard getauscht zu einem Modell mit SATA on Board. Der smartd kann wieder laufen ohne das eine der Platten aus dem RAID herausgekickt wird.

Allerdings passiert es bei jedem 3. oder 4. Bootvorgang, daß das RAID ohne erkennbaren Grund einen Resync macht. Heute morgen z.B.:
backup:~ # cat /proc/mdstat
Personalities : [raid6] [raid5] [raid4]
md0 : active raid5 sde1[0] sdb1[3] sdc1[2] sdd1[1]
2930279808 blocks level 5, 64k chunk, algorithm 2 [4/4] [UUUU]
[===>.................] resync = 17.3% (169460608/976759936) finish=129.4min speed=103931K/sec
bitmap: 193/233 pages [772KB], 2048KB chunk

unused devices: <none>

in messages finde ich keine Fehlermeldung der Platten, nur daß der smartd sie erkannt hat. Die letzten Einträge lauten:
Nov 15 08:00:55 backup smartd[2806]: smartd 5.39 2008-05-08 21:56 [i686-pc-linux-gnu] (local build) Copyright (C) 2002-8 by Bruce Allen, http://smartmontools.sourceforge.net
Nov 15 08:00:55 backup smartd[2806]: Opened configuration file /etc/smartd.conf
Nov 15 08:00:55 backup smartd[2806]: Drive: DEVICESCAN, implied '-a' Directive on line 25 of file /etc/smartd.conf
Nov 15 08:00:55 backup smartd[2806]: Configuration file /etc/smartd.conf was parsed, found DEVICESCAN, scanning devices
Nov 15 08:00:55 backup smartd[2806]: Problem creating device name scan list
Nov 15 08:00:55 backup smartd[2806]: Device: /dev/sda, opened
Nov 15 08:00:55 backup SuSEfirewall2: Setting up rules from /etc/sysconfig/SuSEfirewall2 ...
Nov 15 08:00:55 backup SuSEfirewall2: using default zone 'ext' for interface eth0
Nov 15 08:00:55 backup smartd[2806]: Device /dev/sda: using '-d sat' for ATA disk behind SAT layer.
Nov 15 08:00:55 backup smartd[2806]: Device: /dev/sda, opened
Nov 15 08:00:56 backup smartd[2806]: Device: /dev/sda, not found in smartd database.
Nov 15 08:00:56 backup smartd[2806]: Device: /dev/sda, is SMART capable. Adding to "monitor" list.
Nov 15 08:00:56 backup smartd[2806]: Device: /dev/sdb, opened
Nov 15 08:00:56 backup smartd[2806]: Device /dev/sdb: using '-d sat' for ATA disk behind SAT layer.
Nov 15 08:00:56 backup smartd[2806]: Device: /dev/sdb, opened
Nov 15 08:00:56 backup smartd[2806]: Device: /dev/sdb, found in smartd database.
Nov 15 08:00:56 backup smartd[2806]: Device: /dev/sdb, is SMART capable. Adding to "monitor" list.
Nov 15 08:00:56 backup smartd[2806]: Device: /dev/sdc, opened
Nov 15 08:00:56 backup smartd[2806]: Device /dev/sdc: using '-d sat' for ATA disk behind SAT layer.
Nov 15 08:00:56 backup smartd[2806]: Device: /dev/sdc, opened
Nov 15 08:00:56 backup smartd[2806]: Device: /dev/sdc, found in smartd database.
Nov 15 08:00:56 backup smartd[2806]: Device: /dev/sdc, is SMART capable. Adding to "monitor" list.
Nov 15 08:00:56 backup smartd[2806]: Device: /dev/sdd, opened
Nov 15 08:00:56 backup smartd[2806]: Device /dev/sdd: using '-d sat' for ATA disk behind SAT layer.
Nov 15 08:00:56 backup smartd[2806]: Device: /dev/sdd, opened
Nov 15 08:00:56 backup smartd[2806]: Device: /dev/sdd, found in smartd database.
Nov 15 08:00:57 backup smartd[2806]: Device: /dev/sdd, is SMART capable. Adding to "monitor" list.
Nov 15 08:00:57 backup smartd[2806]: Device: /dev/sde, opened
Nov 15 08:00:57 backup smartd[2806]: Device /dev/sde: using '-d sat' for ATA disk behind SAT layer.
Nov 15 08:00:57 backup smartd[2806]: Device: /dev/sde, opened
Nov 15 08:00:57 backup smartd[2806]: Device: /dev/sde, found in smartd database.
Nov 15 08:00:57 backup smartd[2806]: Device: /dev/sde, is SMART capable. Adding to "monitor" list.
Nov 15 08:00:57 backup smartd[2806]: Monitoring 0 ATA and 5 SCSI devices
Nov 15 08:00:57 backup SuSEfirewall2: batch committing...
Nov 15 08:00:57 backup smartd[2906]: smartd has fork()ed into background mode. New PID=2906.
Nov 15 08:00:57 backup SuSEfirewall2: Firewall rules successfully set
Nov 15 08:27:19 backup sshd[3293]: Accepted keyboard-interactive/pam for root from 192.168.15.10 port 2997 ssh2
backup:~ #

hat vielleicht dazu jemand eine Idee oder einen Rat?

Danke schon mal und Grüße
 
Oben