• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

Suse 11.0 hängt sich unter ESX 3.5 auf

protom

Newbie
Hallo Forum,

ich habe hier ein Problem, daß mich schon sein 3 Monaten quält:
In unregelmässigen Abständen lässt das System kein Schreiben auf die Festplatte mehr zu und hängt sich dann allmählich völlig auf.
Folgende Konstellation/Randbedingungen:

Kernel 2.6.25.5-1.1-pae
Installation unter ESX 3.5
Filesystem EXT3
Hardware IBM Blade Center S, keine USB's, Partitionierung 1 grosses Filesystem mit genügend freiem Speicher, 1 CPU
7 Benutzer Durchschnittslast und Last bei Ausfall < 0,5, 1GB Speicher zugewiesen, 0,45GB benutzt
/etc/fstab
Code:
/dev/sda1            swap                 swap       defaults              0 0
/dev/sda2            /                    ext3       acl,user_xattr        1 1
proc                 /proc                proc       defaults              0 0
sysfs                /sys                 sysfs      noauto                0 0
debugfs              /sys/kernel/debug    debugfs    noauto                0 0
devpts               /dev/pts             devpts     mode=0620,gid=5       0 0
~

Bei Recherchen bin ich auf ähnliche Probleme anderer User gestossen. Es scheint so zu sein, daß die Festplatte in den read-only modus wechselt um Datenverluste zu vermeiden. Die Platte ist in keinem Cluster o.ä.
Als Ursache/Lösung wurden Probleme des 2.6er Kernels mit den LSI-Treibern der Festplatte als bekannt genannt und ein Wechel auf buslogic empfohlen.
Dies habe ich vor 3 Wochen getan und nun wieder gleiches Problem. Die Maschine hatte gestern ca. 22:48Uhr die letzten Einträge in Logfiles unter /var/log die n. m. E. nichts schlimmes enthielten und dann erst wieder Einträge vom Bootvorgang heute 6:38Uhr.
Ich konnte die Originalmaschine diesmal noch sauber herunterfahren und unter ESX zur Fehlersuche klonen.
Der Neustart dauerte deutlich länger als gewohnt aber seit dem läuft die Maschine wieder.
Wann der nächste "Absturz" stattfinden wird ist unklar, es kann in 3 Minuten sein oder in 3 Wochen, beides schon erlebt.

Es läuft im wesentlichen ein Intranet mit PHP 5.2.6 / MYSQL 5.0.67-log.
Es gibt mehrere replizierte Maschinen, die stabil laufen.

Nächste Massnahmen werden sein: Upgrade auf Host ESX 4 und/oder Umstieg auf Gast CentOS 5.1 o.ä.

Habt Ihr evtl. noch Ideen ? In welchen Log-Files ausser /var/log/messages oder /var/log/warn könnte ich noch nach Ursachen suchen ?

Ich tappe völlig im Dunkeln und bin mir nicht mal sicher ob ich im richtigen Forum/Thema gelandet bin :???: aber

für alle konstruktiven Vorschläge vielen Dank und mit freundlichem Gruß
 
OP
P

protom

Newbie
Danke für den Hinweis. Mach ich selbstverständlich, genauso wie ich neue Erkenntnisse in der Sache mitteile, so es welche gibt.
 
Oben