• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

NETZWERK FEHLER NACH STROMAUSFALL ??

rimimaus

Newbie
Hi,
seit 6 Tagen (Stromausfall in NRW) habe ich echt Probleme mit meinem Netzwerk.
Installiert sind 2 Linux Rechner - 1 x Samba und 1 x Mailserver. Die Clients sind Win XP und noch einige Win 98.

Das Problem - Nach dem Stromausfall / Stromschwankungen melden die Clients sich (manchmal) nicht richtig an und es kommt sehr häufig vor, dass Samba für kurze Zeit einfach einfriert. Für einige Sekunden ist dann der Zugriff auf die Netzlaufwerke nicht möglich. Das führt bei Software mit Netzzugang unweigerlich zum Absturz.
Auffällig auf der Start einiger Clients. Im Arbeitsplatz sind die Netzlaufwerke zwar da, aber mit rotem Kreuz versehen. Klickt man auf das Netzwerklaufwerk ist alles OK - zumindest bis zur nächsten Unterbrechung.
An den Servern wurde nichts geändert - diese liefen vorher 6 Monate ohne jede Beanstandung.

Hat jemand eine Idee was da wohl faul ist ?????
 

Dr. Glastonbury

Advanced Hacker
Hi,
haste schonmal deine Logfiles durchgekrämpelt?
Hat vielleicht der Switch was beim Stromausfall abbekommen?
Schonmal getestet, ob auch lange Ping-Perioden Verlustfrei ankommen?

Hmm - und zum Schluss vielleicht mal n fsck und memtest, wobei es daran wohl eher nicht liegen wird ;)
 
OP
R

rimimaus

Newbie
Hi,
danke für deine schnelle Antwort. Switch(e) sind geprüft (eine vorsorglich ausgetauscht).
Hier einmal Prot. messages der letzen par Minuten. Dec 1 16:35:09 gtfile smbd[10505]: [2005/12/01 16:35:09, 0] lib/util_sock.c:send_smb(647)
Dec 1 16:35:09 gtfile smbd[10505]: Error writing 4 bytes to client. -1. (Connection reset by peer)
Dec 1 16:35:18 gtfile smbd[10117]: [2005/12/01 16:35:18, 0] lib/util_sock.c:read_socket_data(384)
Dec 1 16:35:18 gtfile smbd[10117]: read_socket_data: recv failure for 4. Error = Connection reset by peer
Dec 1 16:35:40 gtfile smbd[10077]: [2005/12/01 16:35:40, 0] lib/util_sock.c:read_socket_data(384)
Dec 1 16:35:40 gtfile smbd[10077]: read_socket_data: recv failure for 4. Error = Connection reset by peer
Dec 1 16:35:40 gtfile smbd[10109]: [2005/12/01 16:35:40, 0] lib/util_sock.c:read_socket_data(384)
Dec 1 16:35:40 gtfile smbd[10109]: read_socket_data: recv failure for 4. Error = Connection reset by peer
Dec 1 16:35:42 gtfile smbd[10071]: [2005/12/01 16:35:42, 0] lib/util_sock.c:read_socket_data(384)
Dec 1 16:35:42 gtfile smbd[10071]: read_socket_data: recv failure for 4. Error = Connection reset by peer
Dec 1 16:38:23 gtfile smbd[10548]: [2005/12/01 16:38:23, 0] lib/util_sock.c:write_socket_data(430)
Dec 1 16:38:23 gtfile smbd[10548]: write_socket_data: write failure. Error = Connection reset by peer
Dec 1 16:38:23 gtfile smbd[10548]: [2005/12/01 16:38:23, 0] lib/util_sock.c:write_socket(455)
Dec 1 16:38:23 gtfile smbd[10548]: write_socket: Error writing 4 bytes to socket 26: ERRNO = Connection reset by peer
Dec 1 16:38:23 gtfile smbd[10548]: [2005/12/01 16:38:23, 0] lib/util_sock.c:send_smb(647)
Dec 1 16:38:23 gtfile smbd[10548]: Error writing 4 bytes to client. -1. (Connection reset by peer)
Dec 1 16:38:38 gtfile smbd[10507]: [2005/12/01 16:38:38, 0] lib/util_sock.c:read_socket_data(384)
Dec 1 16:38:38 gtfile smbd[10507]: read_socket_data: recv failure for 4. Error = Connection reset by peer
Dec 1 16:39:42 gtfile smbd[10652]: [2005/12/01 16:39:42, 0] lib/util_sock.c:read_socket_data(384)
Dec 1 16:39:42 gtfile smbd[10652]: read_socket_data: recv failure for 4. Error = Connection reset by peer
Dec 1 16:43:00 gtfile smbd[10761]: [2005/12/01 16:43:00, 0] lib/util_sock.c:get_peer_addr(1150)
Dec 1 16:43:00 gtfile smbd[10761]: getpeername failed. Error was Transport endpoint is not connected
Dec 1 16:43:00 gtfile smbd[10761]: [2005/12/01 16:43:00, 0] lib/util_sock.c:write_socket_data(430)
Dec 1 16:43:00 gtfile smbd[10761]: write_socket_data: write failure. Error = Connection reset by peer
Dec 1 16:43:00 gtfile smbd[10761]: [2005/12/01 16:43:00, 0] lib/util_sock.c:write_socket(455)
Dec 1 16:43:00 gtfile smbd[10761]: write_socket: Error writing 4 bytes to socket 5: ERRNO = Connection reset by peer
Dec 1 16:43:00 gtfile smbd[10761]: [2005/12/01 16:43:00, 0] lib/util_sock.c:send_smb(647)
Dec 1 16:43:00 gtfile smbd[10761]: Error writing 4 bytes to client. -1. (Connection reset by peer)
Dec 1 16:49:52 gtfile smbd[10826]: [2005/12/01 16:49:52, 0] smbd/service.c:make_connection(794)
Dec 1 16:49:52 gtfile smbd[10826]: schmidt (192.168.99.2) couldn't find service datenpfad


das merkwürdige - kurz vorher war für ca. 1 Stunde Ruhe ??!?
 

Dr. Glastonbury

Advanced Hacker
Hmmm sieht eigentlich ganz normal aus^^
Zumindest hab ich bei mir auch reihenweise die Reset by Peer-Fehler stehen...

Die einzige Zeile die Seltsam aussieht ist die letzte:
Code:
Dec 1 16:49:52 gtfile smbd[10826]: schmidt (192.168.99.2) couldn't find service datenpfad
Was für einen Service ist das?
 
OP
R

rimimaus

Newbie
Hello,
zur Fehlermeldung
Dec 1 16:49:52 gtfile smbd[10826]: schmidt (192.168.99.2) couldn't find service datenpfad
kann ich folgendes sagen. SCHMIDT ist ein User und DATENPFAD ist ein freigegebenes Verzeichnis. Wenn u.a. diese Meldung auftraucht können sich die User nicht mehr anmelden und Zugriff auf Server ist nicht möglich.
Auch gerne genommen sind folgende Meldungen in messages:

Dec 2 09:29:51 gtfile smbd[12026]: [2005/12/02 09:29:51, 0] lib/util_sock.c:get_peer_addr(1150)
Dec 2 09:29:51 gtfile smbd[12026]: getpeername failed. Error was Transport endpoint is not connected

Dec 2 09:30:27 gtfile smbd[12034]: [2005/12/02 09:30:27, 0] smbd/dir.c:dptr_close(271)
Dec 2 09:30:27 gtfile smbd[12034]: Invalid key 256 given to dptr_close


Irgendetwas im Netzwerk sorgt dafür, dass kurz die Netzverbindung unterbrochen wird. Gestern abend (keine frustrierten Benuter mehr im Büro) habe ich mal 10 GB vom Server auf eine Workstation kopiert - ohne Probleme.
Was kann dieser Mist wohl sein ??
 

Frankie777

Advanced Hacker
Scan mal mit Ethereal, da sollte man mehr sehen, die Probleme liegen wohl nicht auf Samba Protokollebene.
Ebenso Dauerpings quer durchs Netzwerk machen und auf Paketverlust prüfen.

Was für Switche hast Du und wie alt?
Das verhalten sieht so ähnlich aus, wie wenn Switche altern..
Testweise mal einen Switch austauschen

Kann natürlich auch der Samba-Server als solcher sein. Ich würde den man testweise auf einer anderen Hardware laufen lassen.
 
OP
R

rimimaus

Newbie
hello,
ich habe gerade den samba server vom netz genommen und eine win xp mit netzfreigabe bereitgestellt. wir werden sehen, was nun passiert.

zu den fragen:

Scan mal mit Ethereal, da sollte man mehr sehen, die Probleme liegen wohl nicht auf Samba Protokollebene.

programm kannte ich noch nicht. habe es gerade installiert und gestartet. we will see what happend


Ebenso Dauerpings quer durchs Netzwerk machen und auf Paketverlust prüfen.

keine paketverluste bemerkt


Was für Switche hast Du und wie alt?
3 x 3com superstack. einen habe ich schon vorsorglich durch einen neuen ersetzt. die anderen wurden abgeschaltet und netzkabel getrennt. keine verbesserung

Das verhalten sieht so ähnlich aus, wie wenn Switche altern..
Testweise mal einen Switch austauschen

s. o.

Kann natürlich auch der Samba-Server als solcher sein. Ich würde den man testweise auf einer anderen Hardware laufen lassen.


die dusselige xp workstation läuft nun seit 2 stunden ohne irgend ein problem. fazit - der samba server hat probleme.
hat einer eine idee was da passiert sein kann ??
 

Frankie777

Advanced Hacker
Netzwerkkarte am Samba tauschen
Samba auf anderen Rechner installieren
Ist Hardware des Samba Rechners schlapp, insbesondere das Netzeil?
unsaubere Spannung, nur 190 V ?
 
OP
R

rimimaus

Newbie
Netzwerkkarte am Samba tauschen

werde ich gleich mal machen

Samba auf anderen Rechner installieren
ungern, aber wenn es nicht anders geht ?!


Ist Hardware des Samba Rechners schlapp, insbesondere das Netzeil?

nein, rechner ist reiner dell-server

unsaubere Spannung, nur 190 V ?

werde ich mal prüfen
 
OP
R

rimimaus

Newbie
Hi zusammen,
hab' jetzt den Server mal vom Netz genommen um in Ruhe den Fehler zu analysieren.
Folgendes passiert:
Beim Server anmelden und Daten abrufen funktioniert. Die Netzaktivitäten habe ich mit Ethereal untersucht. Nach unbestimmter Zeit (5, 10, 30 Min) meldet Ethereal nach Session keep alive einen Fehler bei TCP netbios-ssn > 2701 und zwar NBSS [TCP Out-of-Order]. Wird dieser Fehler angezeigt, ist der Server für kurze Zeit im Netz einfach weg.
Netzwerkkarte fällt aus, wurde ausgetauscht. Spannung fällt aus, ist gemessen und ok.
Hat jemand eine Ahnung oder ein Tip ?
 
OP
R

rimimaus

Newbie
hallo nocheinmal,
so, ich habe nun auch ein samba update 3.0.20b installiert und smb.conf angepasst und neue netzwerkkarte eingebaut.
nach ca. 1 std. taucht der fehler wieder auf.

hat jemand eine idee was man da noch machen kann ??
 
Oben