Diese Website existiert nur weil wir Werbung mit AdSense ausliefern.
Bitte den AdBlocker daher auf dieser Website ausschalten! Danke.

[Problem] Diskless Cluster unter Suse 9.0

Alles rund um das Internet, Internet-Anwendungen (E-Mail, Surfen, Cloud usw.) und das Einrichten von Netzwerken einschl. VPN unter Linux

Moderator: Moderatoren

Antworten
grinning-Joker
Newbie
Newbie
Beiträge: 2
Registriert: 15. Apr 2004, 12:26

[Problem] Diskless Cluster unter Suse 9.0

Beitrag von grinning-Joker »

Also....
Ich hoffe ich hab das richtige Unterforum gefunden. Wenn nicht bitte verschieben.

In meiner Tätigkeit als Praktikant muss ich einen Diskless Beowulfcluster aufsetzen und irgendwie will das ganze noch nicht so wie ich will.

Kurz zur Hardware:
5 Rechner mit folgender Konfiguration:
- Shuttle AK32VN Board
- 2,2 Ghz Athlon
- 256 MB RAM
- onboard Realtek VT6103 PHY LAN mit Boot-ROM

Einer Der Rechner hat noch CD-ROM und Festplatte mit SuSe 9.0. Die anderen 4 sollen komplett über das Netzwerk Booten (also ohne Diskettenlaufwerk).

Zum aufgesetzten System:
/etc/hosts

Code: Alles auswählen

27.0.0.1       localhost

# special IPv6 addresses
fe00::1             localhost ipv6-localhost ipv6-loopback

fe00::0         ipv6-localnet

ff00::0         ipv6-mcastprefix
ff02::1         ipv6-allnodes
ff02::2         ipv6-allrouters
ff02::3         ipv6-allhosts

192.168.0.2     node1.local     node1
192.168.0.1     master.local    master
in der /etc/host.conf wurde "order hosts" und "multi on" aktiviert.

/etc/exports

Code: Alles auswählen

/mnt/nfs/       *(rw,no_root_squash)
ich gebe zu, dass ist vielleicht nicht die sicherste Lösung, aber die einfachste ^^

/etc/inetd.conf
"bootps dgram udp wait -s /tftpboot"
ist aktiviert

/etc/bootptab

Code: Alles auswählen

.default:\
        :ht=ether:\
        :dn=joof.de:\
        :ds=192.168.0.1:\
        :sm=255.255.255.0:\
        :ns=12.168.0.1:\
        :gw=192.168.0.1:\
        :vm=rfc1048:\
        :hn:to=-18000:
nodelocal:ip=192.168.0.2:ha=00301b2e1986:tc=.default:
/etc/inetd.d/tftp

Code: Alles auswählen

service tftp
{
        socket_type     = dgram
        protocol        = udp
        wait            = yes
        user            = root
        server          = /usr/sbin/in.tftpd
        server_args     = -c -s /tftpboot
        disable         = no
        per_source      = 11
        cps             = 100 2
}
/tftpboot ist als verzeichnis angelegt und
"chown root:root /tftpboot" wurde ausgeführt

/tftpboot/pxelinux.cfg/default

Code: Alles auswählen

DEFAULT linux root=/dev/nfs nfsroot=192.168.0.1:/mnt/nfs
Die Datei pxelinux.0 liegt in /tftpboot

Nun zum eigendlichen Problem:
Der eingerichtete Knoten findet beim starten den Kernen und bootet ihn.
Dann allerdings kommt folgende Meldungen:

Code: Alles auswählen

Looking up port of RPC 100003/2 on 192.168.0.1
RPC: sendmsg returned error 101
Root-NFS: Unable to get nfsd port number from server, using default
RPC: sendmsg returned error 101
mount: RPC call returned error 101
Root-NFS: Server returned error -101 while mounting /mnt/nfs
VFS: Unable to mount root fs via NFS, trying floppy.
VFS: Insert root floppy and press ENTER
Im Systemlog finde ich folgende Einträge wenn ich den Knoten boote:

Code: Alles auswählen

Apr 15 11:55:02 master dhcpd: DHCPDISCOVER from 00:30:1b:2e:19:86 via eth0
Apr 15 11:55:02 master dhcpd: DHCPOFFER on 192.168.0.2 to 00:30:1b:2e:19:86 via eth0
Apr 15 11:55:02 master inetd[3970]: getpwnam: -s: No such user
Apr 15 11:55:02 master inetd[1959]: /tftpboot: exit status 1
<<< das wiederholt sich um die 40 mal >>>
Apr 15 11:55:02 master inetd[3970]: getpwnam: -s: No such user
Apr 15 11:55:02 master inetd[1959]: /tftpboot: exit status 1
Apr 15 11:55:02 master inetd[1959]: bootps/udp server failing (looping), service terminated
Apr 15 11:55:04 master dhcpd: DHCPREQUEST for 192.168.0.2 (192.168.0.1) from 00:30:1b:2e:19:86 via eth0
Apr 15 11:55:04 master dhcpd: DHCPACK on 192.168.0.2 to 00:30:1b:2e:19:86 via eth0
Apr 15 09:55:04 master in.tftpd[4226]: tftp: client does not accept options 
Nun die alles bedeutende Frage ;) :
Was hab ich falsch gemacht oder noch nicht gemacht?

Ich komme seit 3 Tagen nicht wirklich weiter.

Meine vorschtige Vermutung besteht darin, dass er noch Probleme mit dem NFS-Root Dateisystem hat.
Ein RedHat Rechner den ich mal spaßeshalber angeschlossen habe konnte allerdings auf meinen Master zugreifen.

Ich habe bereits mit Yast eine Rootdiskette erstellt und den Inhalt der Diskette nach /tftpboot/ , /tftpboot/192.168.0.2/ und nach /mnt/nfs/ verschoben.

Im Netz habe ich keine weiteren grossartigen hilfen gefunden und nachdem ich erst mit diesem Projekt mit Linux wirklich befasse (also mehr als Surfen, Chatten und MP3 höhren) kann ich nicht mal Ahnen welche Fehlermeldungen mit was zu tun haben.

Daher auch meine komplette Konfiguration des Systems.

Hoffe auf baldige Antwort

grinning-Joker

PS: mit der Boardsuche hab ich auch nix verwertbares gefunden, aber ich bitte um nachsicht, wenn das Problem schon mal gelöst wurde un d ich zu blöd zum Suchen bin.
grinning-Joker
Newbie
Newbie
Beiträge: 2
Registriert: 15. Apr 2004, 12:26

Beitrag von grinning-Joker »

*bumb*
keiner da der was damit anfangen kann?
Antworten