• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

System friert beim booten ab und zu ein

easyping

Newbie
Hallo,

ich habe folgendes Problem:

ab und zu friert das System (OpenSuse 11.3, AMD Athlon X4 605e, Gigabyte Mainborad 870A-UD3, SSD und SATA Platten) ein.

Dies tritt hauptsächlich dann auf, wenn das System längere Zeit nicht gestartet wurde (genauer Zeitabstand habe ich noch nicht herausgefunden).
Das ganze geschieht zwischen der Anzeige vom Laden des initrd und dem OpenSuse Bildschirm beim starten, wobei dieser nicht angezeigt wird sondern nur ein schwarzer Bildschirm.

Wenn ich dann das System ausschalte und anschließend wieder ein, startet das System ganz korrekt.

Kann mir jemand einen Tipp geben, an was das liegen könnte?

Gruß
Christian
 

lOtz1009

Moderator
Teammitglied
Nimm als Bootoption noch zusätzlich splash=verbose damit der Screen mit dem Ladebalken nicht angezeigt wird, sondern die Bootmeldungen. Evtl. kommt man so an ein paar nützliche Infos ;)
 
OP
E

easyping

Newbie
Vielen Dank für den Tipp, nur leider erscheint keine Informationen, sondern auch nur ein schwarzer Bildschirm.
Darauf hin habe ich mal splash=off gesetzt, nur kommt dort auch nur ein schwarzes Bild.

Gibt es noch einen anderen Modus, der mir weiter helfen kann?
 
Du fährst das System ganz normal runter? Nicht das Du da in irgendeinen sleep-Modus gehst bei dem der Rechner Schwierigkeiten hat wieder hoch zu kommen. Zusätzlich noch ein Windows drauf? Passiert es evtl. immer wenn Du vorher im Windows warst?
 
OP
E

easyping

Newbie
Auf dem System ist nur OpenSuse 11.3 installiert. Des Weiteren wird das System immer herunter gefahren.
 
A

Anonymous

Gast
Probiers mal mit vga=normal. Oder lass die Option ganz weg...
 

josef-wien

Ultimate Guru
GRUB funktioniert, aber sobald er Kernel und initrd auf die Reise schickt (oder schicken will), gibt es ein Problem. Mir fallen folgende mögliche Problemfelder ein:

1. BIOS (da gab es vor kurzem eine ähnliche Kuriosität samt Abhilfe: http://www.linux-club.de/viewtopic.php?f=4&t=110273&p=687655&p687655).

2. Festplatte (überprüfe sie mit einem Werkzeug Deines Festplatten-Herstellers oder mit dem Hitachi Drive Fitness Test).

3. Temperatur (irgendein Bauteil braucht Wärme, aber frage mich nicht, wie Du den identifizierst; wenn es der Hauptspeicher ist, könnte memtest+ auch nur in einer sehr kalten Umgebung etwas finden).
 
OP
E

easyping

Newbie
Nachdem ich die Option vga weggelassen habe, sah ich die folgende Zeilen:

Code:
usb-2-5: new high speed USB device using ehci_hcd and address 5
usb-2-5: device not accepting address 5, error -110
hub 2-0:10: unable to enumerate USB device on port 5
usb-2-5: new high speed USB device using ehci_hcd and address 6 
usb-2-5: device not accepting address 6, error -110
hub 2-0:10: unable to enumerate USB device on port 6
usb-5-4: new low speed USB device using ohci_hcd and adresse 2
irg18: nobody carred (try booting with the irqpoll option)
Pid: 0, comm: swapper Taited: G   D  2.6.34-12-desktop #1
Call Trace ......
......
Disable IRQ 18
ohci_hcd 000:00:13,0 unlink after no-IRQ? controller is probably using the wrong IRQ.

Laut der Information, werde ich nun mal mit der Option irqpoll das System starten und schauen ob es funktioniert.

Was bewirkt diese Option (irqpoll)?
 
OP
E

easyping

Newbie
Nun habe ich folgendes:
Code:
Call Trace
dump_trace+0x79/0x340
dump_stack+0x69/0x6f
panic+0x90/0x135
forget_original_parent+0x243/0x250
exit_notify+0x10/0x180
do_exit+0x1b3/0x3e0
oops_end+09c/0e0
general_protection+0x1f/0x30
acpi_ns_get_attached_object+0x1f/0x30
acpi_ds_exec_end_op+0x32e/0x56b
acpi_ps_parse_loop+0x325/0x396
acpi_ps_parse_aml+0xff/0x3a9
acpi_ds_execute_arguments+0x111/0x12e
acpi_ns_init_one_object+0xb1/0x140
acpi_ns_walk_namespace+0xcc/0x1ae
acpi_walk_namespace+0x8d/0xc0
acpi_ns_initialize_objects+0x8d/0x198
acpi_initialize_objects+0x7d/0x7d
acpi_bus_init+0xa2/0y1d9
acpi_init+0x69/0xe4
do_one_initcall+0x34/0x1a0
kernel_init+0x148/0x1d4
kernel_thread_helper+0x4/0x10

Danach ein Neustart und der PC funktioniert mit den gleichen Startparameter.
 
OP
E

easyping

Newbie
Da mein System immer noch das Problem hat, habe ich zum testen mal die 32bit Version von OpenSuse 11.3 parallel auf einer separaten Partition eingerichtet. Beim starten, sprich das System ist einigen Stunden aus, dieser Version kommt dann folgende Fehlermeldungen

Code:
pci 0000:00:00.: no compatible bridge window for [mem 0xe0000000-0xffffffff 64bit]
doing test boot
/init: line 22 128 Segmentation fault modeprobe $module
/init: line 22 129 Segmentation fault modeprobe $module
/init: line 22 130 Segmentation fault modeprobe $module
/init: line 22 131 Segmentation fault modeprobe $module
/init: line 22 132 Segmentation fault modeprobe $module
/init: line 22 133 Segmentation fault modeprobe $module
/init: line 22 134 Segmentation fault modeprobe $module
Creating device nodes udev
udev-work[180]: '/sbin/modeprobe -bv pci:v00001002d0000 439Dsv00001002sd0000439Db
udev-work[198]: '/sbin/modeprobe -bv acpi:device 'unexpected exit with status 0
[drm]nouveau 0000:01:00.0: Pointer to BIT load val table invalid
fb:conflicting fb hw usage nouveaub vs VESA VGA - removin gene
udevadm settle -timeout of 30 secounds reached, the event queue contains:
boot/04-udev.sh: line 16: 165 Segmentation fault /sbin/udevadm settle --timeout=$udev_timeout
init[1]:segfault at fbfe81bc ip b76609c7 sp bfdecd78 error 7 in libc-2.11.2.so [b75f1000+164000]
Kernel panic - not syncing: Attempted to kill init!
[drm:drm_fb_helper_panic]*ERROR* panic occurred, switching back to text console

Nach einer Recherche über die erste Fehlerzeile, habe ich nach einigen Stunden die 64bit Version mit dem Kernel Parameter pci=use_crs gestartet und erhielt folgende Fehlermeldungen:

Code:
init[1]:segfault at 8 ip 00007fdb44ee5097 SP 00007ffff0ec1588 error 4 in ld-2.11.2.so [7fdb44ed7000+1f000]
swap_free: Bad swap file entry c07fffc400a7c482
BUG: Bad page map in process init pte:ffff88014f8904b0 pmd: 14ce89067
addr: 00007fdb450f0000 vm_flags: 00100073 anon_vma: ffff88014cea4378 mapping:(null) index 7fdb450f0
swap_free: Bad swap file entry b000000000000002
BUG: Bad page map in process init pte:000004ac pmd: 14ce89067
addr: 00007fdb450f1000 vm_flags: 00100073 anon_vma: ffff88014cea4378 mapping:(null) index 7fdb450f1
BUG: Bad page map in process init pte:10000001 pmd: 14ce89067
page: ffffea0003800000 count:1 mapcount:-1 mapping:(null) index: 0x0
page flags: 0x40000000000400(reserved)
addr: 00007fdb450f2000 vm_flags: 00100073 anon_vma: ffff88014cea4378 mapping:(null) index 7fdb450f2
BUG: Bad page map in process init pte:c0bd00100 pmd: 14ce89067
addr: 00007fdb450f4000 vm_flags: 00100073 anon_vma: ffff88014cea4378 mapping:(null) index 7fdb450f4
BUG: Bad page map in process init pte:4c848a7e pmd: 14ce89067
addr: 00007fdb450f7000 vm_flags: 00100073 anon_vma: ffff88014cea4378 mapping:(null) index 7fdb450f7
BUG: Bad page state in process init ptn: 100000
page: ffffea0003800000 count:1 mapcount:-1 mapping:(null) index: 0x0
page flags: 0x40000000000400(reserved)
BUG: Bad page state in process init ptn: 14ce89
page: ffffea00048d2f8 count:0 mapcount:0 mapping:(null) index: 0x0
page flags: 0x40000000000080(slab)
Kernel panic_not syncing: Attempted to kill init!

Wie schon in meinen anderen Beiträgen hinzu, funktioniert das System nach dem ich dieses noch einmal ausschalte und wieder startet, ohne Probleme.

Was könnte ich noch ausprobieren?
 

lOtz1009

Moderator
Teammitglied
Ich weiß nicht...aber so Schlagwörter wie segfault, bug und Kernel_panic würden mich an deiner Stelle dazu animieren, einen Report auf https://bugzilla.novell.com einzureichen.
 

wolfi_z

Hacker
Ich habe seit gestern ein aehnliches Problem mit meinem Laptop, und zwar leider nicht nur ab und zu, sondern eben seitdem jedesmal.

Nach der Startmaske (wo man openSUSE 11.3 / openSUSE 11.3 failsafe waehlen kann, mehr gibts nicht :D ) passiert nichts mehr, schwarzer Bildschirm.
Ich habe sogar schon neu installiert und dabei natuerlich dann auch die Root-Partition neu formatiert - Direkt nach der Installation lief es, erster Rebootversuch wieder tote Hose :igitt:

Meine Vermutung, dass ein Problem mit GRUB vorlaege, scheint wohl nicht zuzutreffen. Ich habe versucht, mit der Super-Grub-Disc zu booten, da kommen einige Zeilen, dann bleibt es stehen. Naechstes Mal mache ich einen Screenshot davon (mit der Kamera, versteht sich, sonst kommt man ja nicht ran ;) )

Jetzt habe ich gestern abend nochmal von 11.3 DVD gebootet und bin auf 'Update-Installation' gegangen, OK, da werden dann nur ein oder zwei Patches nachinstalliert und ich komme danach wieder regulaer rein in die Maschine (sind dann halt ca. zehn Minuten Zeitverlust ...).
Aktuell lasse ich den Laptop einfach laufen.
Ich hoffe, dass es einfach nur irgendein vermoehrtes Paket ist, das dann auch hoffentlich bald wieder durch die Updatemechanismen repariert wird. Das heisst also, den naechsten Reboot versuche ich zumindest auf 'nach-naechstes-Online-Update' bzw. 'nach-naechstes-Mal-zypper-dup-installiert-was' zu verschieben.

Ich werde ggf. weiter berichten, falls Ihr Tipps habt oder dgl., bitte posten ;)

LG ... Wolfi :)
 

josef-wien

Ultimate Guru
GRUB muß funktionieren, denn sonst hättest Du kein Boot-Menü. Kernel und initrd scheinen auch in Ordnung zu sein, wenn der Start nach der Installation klappt. Kommt der schwarze Bildschirm sofort nach erfolgter Auswahl im Boot-Menü, oder wird dazwischen etwas angezeigt? Die Ergebnisse von
Code:
hwinfo --gfx
cat /boot/grub/menu.lst
wären auch zweckmäßig.
 

wolfi_z

Hacker
Arrg, heute frueh im Tran runtergefahren, musste ich wieder ueber ein 'Fake' Update booten ...
Nun ja, so gibts wenigstens den versprochenen Screenshot vom Bootversuch mit der Super Grub Disc ... :roll:



LG ... Wolfi :)
 

wolfi_z

Hacker
Oh, da hat sich grad was ueberschnitten :D

Man sieht absolut nix zwischen Boot-Menu und 'Abgang'; auch wenn ich ESC druecke, um auf den Texthintergrund zu kommen anstatt auf das Chamaeleon mit dem Fieberbalken ... trotzdem nix.
Code:
root@linux-liwh:/home/wolfi> hwinfo --gfx
09: PCI 02.0: 0300 VGA compatible controller (VGA)              
  [Created at pci.318]
  Unique ID: _Znp.DaFqjCgdX75
  SysFS ID: /devices/pci0000:00/0000:00:02.0
  SysFS BusID: 0000:00:02.0
  Hardware Class: graphics card
  Model: "Mobile Intel® GM45 Express Chipset"
  Vendor: pci 0x8086 "Intel Corporation"
  Device: pci 0x2a42 "Mobile Intel® GM45 Express Chipset"
  SubVendor: pci 0x1734 "Fujitsu Technology Solutions"
  SubDevice: pci 0x113f 
  Revision: 0x09
  Driver: "i915"
  Driver Modules: "drm"
  Memory Range: 0xf2400000-0xf27fffff (rw,non-prefetchable)
  Memory Range: 0xd0000000-0xdfffffff (ro,non-prefetchable)
  I/O Ports: 0x1800-0x1807 (rw)
  IRQ: 30 (14115 events)
  I/O Ports: 0x3c0-0x3df (rw)
  Module Alias: "pci:v00008086d00002A42sv00001734sd0000113Fbc03sc00i00"
  Driver Info #0:
    XFree86 v4 Server Module: intel
  Driver Info #1:
    XFree86 v4 Server Module: intel
    3D Support: yes
  Config Status: cfg=no, avail=yes, need=no, active=unknown

10: PCI 02.1: 0380 Display controller
  [Created at pci.318]
  Unique ID: ruGf.k0dSd2zHpkA
  SysFS ID: /devices/pci0000:00/0000:00:02.1
  SysFS BusID: 0000:00:02.1
  Hardware Class: graphics card
  Model: "Intel Mobile 4 Series Chipset Integrated Graphics Controller"
  Vendor: pci 0x8086 "Intel Corporation"
  Device: pci 0x2a43 "Mobile 4 Series Chipset Integrated Graphics Controller"                                                      
  SubVendor: pci 0x1734 "Fujitsu Technology Solutions"                                                                             
  SubDevice: pci 0x113f 
  Revision: 0x09
  Memory Range: 0xf2100000-0xf21fffff (rw,non-prefetchable)
  Module Alias: "pci:v00008086d00002A43sv00001734sd0000113Fbc03sc80i00"
  Config Status: cfg=no, avail=yes, need=no, active=unknown

Primary display adapter: #9


Code:
root@linux-liwh:/home/wolfi> cat /boot/grub/menu.lst
# Modified by YaST2. Last modification on Fri Sep 10 17:03:57 CEST 2010
# THIS FILE WILL BE PARTIALLY OVERWRITTEN by perl-Bootloader
# Configure custom boot parameters for updated kernels in /etc/sysconfig/bootloader

default 0
timeout 8
##YaST - generic_mbr
gfxmenu (hd0,1)/boot/message
##YaST - activate

###Don't change this comment - YaST2 identifier: Original name: linux###
title Desktop -- openSUSE 11.3 - 2.6.34.4-0.1
    root (hd0,1)
    kernel /boot/vmlinuz-2.6.34.4-0.1-desktop root=/dev/sda2 resume=/dev/disk/by-id/ata-FUJITSU_MJA2160BH_G2_K966T9A25HW3-part1 splash=silent quiet  showopts vga=0x361
    initrd /boot/initrd-2.6.34.4-0.1-desktop

###Don't change this comment - YaST2 identifier: Original name: failsafe###
title Failsafe -- openSUSE 11.3 - 2.6.34.4-0.1
    root (hd0,1)
    kernel /boot/vmlinuz-2.6.34.4-0.1-desktop root=/dev/sda2 showopts apm=off noresume nosmp maxcpus=0 edd=off powersaved=off nohz=off highres=off processor.max_cstate=1 nomodeset x11failsafe vga=0x361
    initrd /boot/initrd-2.6.34.4-0.1-desktop
root@linux-liwh:/home/wolfi>

LG ... Wolfi ;)
 

josef-wien

Ultimate Guru
Funktioniert die Failsafe-Variante? Funktioniert es, wenn Du vga=0x361 im Boot-Menü wegläßt? Mehr kann ich zu einer Intel-Grafikkarte nicht beitragen.
 

wolfi_z

Hacker
josef-wien schrieb:
Funktioniert die Failsafe-Variante? Funktioniert es, wenn Du vga=0x361 im Boot-Menü wegläßt? Mehr kann ich zu einer Intel-Grafikkarte nicht beitragen.
Failsafe hilft nix, das Weglassen der Bildschirmaufloesungs-Option hab ich noch nicht ausprobiert ;)

Edit: Das hier habe ich de facto bereits getan: http://www.linux-club.de/viewtopic.php?f=41&t=110975
(mkinitrd, SuSEconfig) aber ich glaube, ich habe danach noch keinen Reboot riskiert. Also nehme ich mal allen meinen Mut zusammen :D

Edit 2: Das hilft alles nix :igitt: Wenn ich die VGA-Option ausschalte, dann kommt genau das, was ich gestern schon als 'Screenshot' reingestellt habe, und trotz mkinitrd und SuSEconfig geht immer noch nix.
Wo gibts denn einen Entwicklerkernel? Den finde ich nicht mehr, wuerde den halt ggf. gerne mal ausprobieren. Ansonsten ist auch 11.4 Milestone-1 erhaeltlich inzwischen ... Dann installier ich notfalls den :D

Edit 3 vom senilen Bettfluechter :D : Ich habe einen Kernel 2.6.34.4-11 gefunden. Der andere war 2.6.34.4-0 (oder 1?). Damit hat soeben der Reboot funktioniert.

Code:
wolfi@linux-liwh:~> uname -a
Linux linux-liwh.site 2.6.34.4-11-default #1 SMP 2010-09-08 15:29:44 +0200 i686 i686 i386 GNU/Linux

LG ... Wolfi :)
 

wolfi_z

Hacker
Nachtrag: Man muss in diesem Falle dann noch Kernel als Repository hinzufuegen, sonst installiert der zypper dup wieder den alten Kernel der nix taugt :igitt:

LG ... Wolfi :)
 

spoensche

Moderator
Teammitglied
Habt ihr es mal mit dem Bootparameter
Code:
acpi=off
versucht? Falls Ihr USB- Sticks oder USB- Festplatten "eingestöpselt" habt, entfernt sie mal und steckt sie erst ein, wenn der Rechner gestartet ist.

Code:
fb:conflicting fb hw usage nouveaub vs VESA VGA - removin gene

Wieso verwendest du den Nouveau Treiber bei einer Intel Graka? Nouveau ist ein Treiber für NVidia.
 
Oben