• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

RAID1 - was ist anders seit 10.3? - Performanceproblem

CHL

Newbie
Hallo liebes Forum,

ich stehe gerade vor einem Rätsel welches ich seit Tagen versuche zu lösen. Wir haben mehrer Maschinen am Laufen. Alle mit ähnlicher Hardware (P4-CPU, 2 bis 4GB RAM, 2xSATA HDD im RAID1 (via md)) und mit SuSE 9.3 bis 10.2 - alles perfekt - alles wunderbar. Auf diesen Maschinen laufen VMWare-Server mit allen möglichen Guests.

Nun kam eine neu Maschine mit SuSE 10.3 dazu und das RAID1 verhält sich komisch. Das System an sich performed wunderbar, das RAID synct sich mit 60-70MB/s und die Maschine ist stabil - sowohl native als auch mit VMWare.

Aber:
Wenn ich noch auf der RAID-Partition (nennen wir Sie einfach md1) eine große Datenmenge (ca. 3GB) lese und gleichzeitig schreibe (also ein einfaches "cp file1 file1.backup" mache) passiert es. Das System wir elend langsam - und die Load steigt auf Werte über 10.0(!). Bei allen anderen Maschinen sind wir in dem Fall bei einer Load von 2 oder 3... Dadurch werden die virtuellen Maschinen enorm eingebremst und Netzwerkdurchsatz sinkt ebenfalls auf lächerliche Werte (deutlich unter 1MB/s).

Die Hardware ist ok - wurde soeben auf einer anderen Maschine ebenfalls mit 10.3 getestet - selbiges Problem.

Mein Verdacht:
Es gibt ja für das RAID die Systemprozesse [md0_raid1] etc. - diese zeigen auf allen Maschinen vor 10.3 nach vielen Tagen doch ein paar verbratene Sekunden CPU Zeit an. Auf 10.3. jedoch benötigen diese Prozesse schon nach kurzer Zeit Minuten wenn es auf der Platte hoch hergeht.

Somit:
Was gab es da für eine Änderung? Eine Idee wäre, dass bis 10.2 beim lesen von RAID1 parallel die angeforderten Teile geholt wurden (somit im Prinzip Lesegeschwindigkeit x2 einer einzelnen Platte). Seit 10.3 dürfte synchron gelesen und verglichen werden was natürlich auf die Sicherheit des RAID1 geht, da jeder Fehler sofort erkannt wird, aber die Geschwindigkeit auf unter 1x der einzelnen Platte drücken würde.

Kann das jemanden Bestätigen? Gibt es Abhilfe? Oder bin ich auf dem Holzweg?

Danke für die Bemühungen!
 
OP
C

CHL

Newbie
um meine Tehorie zu bestätigen habe ich die Kiste jetzt auf 10.2 downgegraded. Ergebnis: Die Maschine rennt wie Sau - Top Performance, native und unter VM-Ware....

Nur:
WAS ist bitte seit 10.3 in Bezug auf RAID1 anders?
 
In 10.3 werden Version 1.0 Superblocks mit Bitmap verwendet (wenn man den Array mit yast erstellt). Versuch doch mal
Code:
mdadm -G /dev/md1 -b none
um die Bitmap auszuschalten und schau, ob es für dich damit besser läuft.
 
OP
C

CHL

Newbie
Danke für den Tip. Ich habe jetzt einmal die Gegenprobe gemacht und unter 10.2 (nachdem ich 10.3 bereits eliminiert hatte) die Bitmap aktiviert. Der Performanceverlust hält sich dabei jedoch sehr in Grenzen und ist nicht wirklich merkbar. Aber ich werde das jedenfalls unter 10.3 auf dem nächsten Server nächste Woche versuchen und berichten.
 
OP
C

CHL

Newbie
Nun habe ich es doch testen können. Selbige Maschine mit 10.3 und exakt selber Aufgabenstellung: in einer größeren virtuellen Maschine ein Backup eines ca. 3GB großen Ordners in ein TAR zu stopfen und auf selbige Platte zu schreiben wo es herkam (ja ich weiß, das is unsinnig, aber halt eine gewachsene Struktur....)

Ich habe für dem Vergleich nun unter 10.3 das RAID1 von Hand angelegt, ohne Bitmap und somit gleich wie auf der 10.2er Maschine.

Der Test lief auch mehrmals um klare Werte zu bekommen. Das Ergebnis:
SuSE 10.2 --> ca. 12 Minuten
SuSE 10.3 --> ca. 22 Minuten

Mit dem RAID1 aus dem Yast (inkl. Bitmap + 1.0 Superblock) dauerte das ganze über eine Stunde und die Maschine war unbenützbar....
 
OP
C

CHL

Newbie
korrekt.... allerdings lief jeweils nur die eine Maschine um vergleichbare Ergebnisse zu erzielen - ansonsten war das System idle...
 
Oben