• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

[gelöst] linux bootet nicht - calltrace einträge

Seeeebi

Newbie
Hallo erstmal.

Ich habe ein Problem, mit welchem ich nicht mehr weiterkomme. Wir hatten vor, einen Server einzurichten und als Firewall zu nutzen, deswegen wollten wir linux aufspielen. Hat auch soweit alles kurz funktioniert, leider fährt der rechner seit gestern nicht mehr hoch.
Das Problem ist, dass er beim booten an den Punkt kommt, bei dem der eintrag "call trace" kommt, danach bringt er bildschirmfüllend einträge wie

[<c10......>]

das problem daran: er bringt nicht einen oder 1000 einträge, nein er bringt über mehr als 5 minuten hinweg abertausende dieser einträge, sodass ich also auch nicht sagen kann, wie die einträge genau lauten (die hinteren 4 oder 5 zifern scrollen dabei so schnell über den bildschirm, dass ich sie nicht mal lesen kann)

aufgetreten ist dieses problem plötzlich, ohne vorhergehende hardware oder softwareänderungen.
jetzt das schärfste: selbst wenn ich die hardware stück für stück tausche (was wir zur fehlereingrenzung gemacht haben) und versuche, von cd zu booten, tritt der fehler auf.
Mittlerweile haben wir übrigens 2 komplett verschiedene rechner (anderes board, andere platte, andere graka, anderes memory, ...) auf denen der gleiche fehler auftritt...

kann damit irgendjemand etwas anfangen, hatte das schon mal oder kann mir sagen, wie ich das wieder wegbekommen kann?

vielen dank schon einmal fürs lesen und danke im vorraus für die hilfe, ich versteh es einfach nicht mehr...

Gruß
Seeeebi

PS: ich hoffe, ich bin hier im richtigen forum ;-)
PPS: Sufu hab ich natürlich genutzt, nur leider auch nichts gefunden...
 
Hi Seeeebi ,

das hört sich so an als wenn der Kernel einen "Panic" erzeugt.
Das heisst Hardware wird angesprochen, die Antwort passt nicht,
oder der Kernel selber hat einen internen Fehler.
Das könnte auch ein Hardwareproblem oder ein Biosproblem sein.

Die erste Fehlermeldung ist interessant. Dabei sollte der Kernel
einen "Stack" (Stapel) anzeigen, auf dem man sieht welche Funktion
welche weitere Funktion aufruft.
=> Kannst du im passenden Augenblick die Ausgabe mit der "Pause/Break Taste anhalten ?

Welche Distribution nutzt du ? Eventuell kann man mit Bootoptionen
einzelne Hardware oder z.B. ein fehlerhaftes Bios anders ansprechen.
Z.B. bei SuSE mit acpi=off

Hast du evtl. eine Knoppix CD aus einer Zeitschrift zur Verfügung ?

Haveaniceday
 
Nach einem Panic ist Schluß. Wenn das über 5 Minuten geht, sind das rekurrierende Oopses, und die findet man in /var/log/messages.
 
OP
S

Seeeebi

Newbie
Hi und schon mal danke, dass ihr euch damit beschäftigst.

Also, eine CD habe ich nicht zur Verfügung.
Genutzt wird ein suse 10.2 bzw zu testzwecken auch ipcop (hier geht der bootvorgang schneller), kA, auf welcher version das beruht.

Fehler:
beim booten von Platte: der beschriebene fehler tritt auf
beim booten mit ipcop-cd: ----""-----
beim booten von install-cd von suse (egal ob rescue system oder neuinstallation): schwarzer bildschirm, keine weiteren reaktionen, allerdings auch kein absturz des systems

drücken der pause-taste bewirkt leider nichts, deswegen hab ich mal ein (lausiges) foto gemacht und werde versuchen, die meldungen zu entziffern...

los geht das ganze mit
Stack: c118dc0a 00000018 c010856a c7fffffa c02000536 c118db76 ... (insgesamt 3 Bildchirmzeilen)

danach kommen die call trace einträge, diese fangen an mit
call trace: [<c010056a>] [<c0108639>] [<c0108742>]...



Kannst du mir vielleicht sagen, wie ich, ohne das system zu starten an die log-dateien komme? vielleicht kann ich damit den fehler etwas genauer eingrenzen...

hoffe, das reicht an angaben, sonst bitte einfach weiter fragen...

Danke
Gruß
Seeebi

PS:
Warum auch immer ich nicht früher darauf gekommen bin: beim booten von Platte im Failsave modus bringt er ein anderes problem (asche über mein haupt, dass ich das nicht früher gemacht habe)

 
Sieht für mich wie evtl. ein Problem im Speicher/MMU aus.

- Versuch mal den Speichertest von der SuSE DVD
- Schaum mal ins BIOS. Ist dort evtl. das "Memory hole 15-16M" verändert worden ?
- Versuch eventuell mal im Bios die Default-Settings zu laden. Aber nicht die "geschwindigkeitsoptimierten"

- Sind eventuell 2 Graphikkarten aktiv ( build in + PCI/AGP-Karte)
=> Dadurch Bildschirm Schwarz im Failsafe Modus ?


- Ist evtl. eine defekte Swap Partition vorhanden ?
=> Hmm ,aber wie dort den Typ ändern wenn rescue nicht bedienbar ist...

Damit wäre ich mit meinen Ideen aus der Ferne am Ende.

Viele Grüße,

Haveaniceday

PS: Bin jetzt bis mindestens 23:00 offline. Aber andere haben bestimmt auch gute Ideen.
 
OP
S

Seeeebi

Newbie
hiho,

hmm, das mit der swap schliesse ich mal aus, da wir das ganze auf 3 verschiedenen platten versucht haben --> immer der gleiche fehler.

memtest hab ich gemacht, keine fehler (und ausserdem auch 4 verschiedene rams in unterschiedlichsten anordnungen verbaut gehabt zum testen.

bios-einstellungen habe ich wissentlich nicht verändert, zumal auf 2 rechnern unterschiedliche einstellungen zum tragen kamen. habe aber trotzdem nochmal die standart-werte zurückgesetzt...

grafikkarte ist in jedem rechner nur eine drin, war nur eine drin und wurde auch keine getauscht oder verändert, als das system noch problemfrei lief. erst nach dem problem habe ich angefangen hardware zu tauschen...

eigentlich kommen für mich nur noch 2 dinge in frage:

1. eine art virus oder sonstige malware, die sich im bios festgeschrieben hat, aber auch auf festplatte noch gespeichert war. diese hat nun über den tausch der hardware alle festplatten und beide boards erreicht, was eine "infektion" von allen platten / boards erklärt.

2. ein hardwaredefekt, den ich aber eigentlich auch ausschliesse, da beide rechner zum gleichen zeitpunkt übern jordan sind. da sämtliche kabel nur einmal vorhanden sind und die rechner nie direkt nebeneinander standen oder ähnliches, ist ausgeschlossen, dass beispielsweise beide von der gleichen spannungsspitze betroffen waren oder das ein anschlussfehler oder ein stoß oder sonstwas zu diesen problemen geführt hat...

gruß sebi

btw: im failsave modus bleibt die kiste nach anzeige dieses bildes hängen und eght nicht weiter (auch hier wieder 5 min gewartet oder so...)
 
>hmm, das mit der swap schliesse ich mal aus, da wir das ganze auf 3 verschiedenen platten versucht haben --> immer der gleiche fehler.
OK

>memtest hab ich gemacht, keine fehler
OK

>bios-einstellungen habe ich wissentlich nicht verändert, zumal auf 2 rechnern unterschiedliche einstellungen zum tragen kamen. habe aber trotzdem nochmal die standart-werte zurückgesetzt...
OK

>grafikkarte ist in jedem rechner nur eine drin, war nur eine drin und wurde auch keine getauscht oder verändert, als das system noch problemfrei lief. erst nach dem problem habe ich angefangen hardware zu tauschen...
OK

>1. eine art virus oder sonstige malware, die sich im bios festgeschrieben hat, aber auch auf festplatte noch gespeichert war. diese hat nun über den tausch der hardware alle festplatten und beide boards erreicht, was eine "infektion" von allen platten / boards erklärt.
Sehe ich als höchst unwahrscheinlich an. Durch den Reset auf Standardwerte sollte zumindest das Failsafe System wieder starten.


> 2. ein hardwaredefekt
gruß sebi

Fehlerszenario: Eine Karte macht Hardware kaputt: Nach Tausch sind dann beide Rechner hin. wäre möglich

> btw: im failsave modus bleibt die kiste nach anzeige dieses bildes hängen und eght nicht weiter (auch hier wieder 5 min gewartet oder so...)[/quote]

Bild fehlt. Häng das hier doch mal an.

Versuch mal alle PCI-Karten (bis auf Graphik) und auch die Festplatte zu entfernen und dann failsave zu booten. Eventuell mit minimaler Speicherkonfiguration.

Das sollte ausschliessen:
- diverse PCI-Karten defekt
- Partition + Platte mit defekter fs-Struktur "reißt" System schon bei der Erkennung runter..

Haveaniceday
 
OP
S

Seeeebi

Newbie
Hiho.

Sry, dass ich mich länger nicht gemeldet habe, war etwas eingespannt und kam nicht dazu, weiter zu doktorn...

mittlerweile habe ich eine lösung gefunden. Der fehler war, dass keine Maus angeschlossen war... muss man auch erst mal drauf kommen *kotz*

naja, danke trotzdem für alle hilfe, nennt mich noob, aber ich konnte mir beim besten willen nicht vorstellen, dass ein command-line basierendes BS eine Maus braucht, um hochzufahren... vielleicht liegts auch an meinem rechner oder an was weiß ich, tatsache ist, dass es jetzt wieder läuft...

danke nochmal an alle...

gruß
Seeeebi
 
Oben