• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

[Gelöst] Sporadische Kernel Abstürze

kzeitler

Newbie
Hallo,
ungefähr einmal pro Woche wird plötzlich aus heiterem Himmel der
Bildschirm schwarz und mein PC bootet neu. Der PC ist relativ neu und
hat mich damit von Anfang an genervt.
memtest zeigt keinen Fehler an. In /var/log/messages steht nicht das
geringste (das hab ich jetzt schon zig mal verifiziert). Ich habe auch
crash dump eingeschaltet:

Code:
dmesg | grep -i crash
[ 0.000000] Command line: BOOT_IMAGE=/vmlinuz-3.7.10-1.16-desktop
root=UUID=989b7d26-ee3e-4a28-9237-bdb7fdb713ae
resume=/dev/disk/by-id/ata-Samsung_SSD_840_Series_S19HNEAD216775K-part2
splash=silent quiet showopts crashkernel=256M-:128M
[ 0.000000] Reserving 128MB of memory at 704MB for crashkernel (System RAM:
7588MB)

Aber in /var/crash steht nie etwas.

Ich habe den PC natürlich auch schon zum Service gebracht, aber das war
(wie ich schon befürchtet hatte) zwecklos. Die Hardware ist angeblich in
Ordnung, was ich nicht so recht glauben will.

Was kann ich denn jetzt als nächstes tun? Gibt's irgendwelche
speziellen Hardware Tests? Ich habe nur Opensuse installiert,
kein anderes Linux und kein windows.

Gruß

Klaus
 

abgdf

Guru
Ich weiß nur, daß ich bei manchen Puppy-Versionen manchmal "Kernel panic" hatte, dann ging nichts mehr. Obwohl die auf vielen tausend anderen PCs problemlos lief.
"Einfach" 'ne andere Distribution versuchen.
 

spoensche

Moderator
Teammitglied
josef-wien schrieb:
P. S. Vielleicht bringt auch
Code:
dmesg | egrep -i "erro|warn|fail|crit|acpi"
Aufschlüsse.

Ich muss dich ein wenig korrigieren. Das o ist bei err ungünstig.

Code:
dmesg | egrep -i "err|warn|fail|fault|crit|acpi|apic"

@kzeitler:

Du kannst dem Kernel auch sagen, dass er im Falle einer Panic einen Coredump als Datei speichern soll. Dazu editierst du die /etc/sysctl.conf und fügst folgende Zeile ein:
Code:
kernel.core_pattern = /var/crash/dump_%p_%uid_%gid

Danach die Änderung mit
Code:
sysctl -p
übernehmen. Wenn das Problem erneut auftritt, dann hast du unter /var/crash einen Coredump zur Analyse zur Verfügung.
 
OP
K

kzeitler

Newbie
Hallo,
erst mal Danke für die Hinweise.

Ich habe jetzt in /etc/sysctl.conf die Zeile
Code:
kernel.core_pattern = /var/crash/dump_%p_%uid_%gid
eingetragen und dann "sysctl -p' eingegeben.
Mal sehen ob ich jetzt irgendwann einen dump bekomme.

Und nun zu: dmesg | egrep -i "err|warn|fail|fault|crit|acpi|apic"
Der letzte (spontane) Reboot war laut /var/log/messages:
Code:
2013-09-17T01:14:37.230711+02:00 lysmata rsyslogd: [origin software="rsyslogd" swVersion="7.2.7" x-pid="902" x-info="http://www.rsyslog.com"] start
und kurz davor finde ich bzgl "APIC|ACPI" folgende 120 Zeilen, die mir gar nichts sagen:

--- snip --

Code:
[Tue Sep 17 01:13:38 2013] BIOS-e820: [mem 0x00000000bf1ec000-0x00000000bf234fff] ACPI NVS
[Tue Sep 17 01:13:38 2013] BIOS-e820: [mem 0x00000000bf235000-0x00000000bf23dfff] ACPI data
[Tue Sep 17 01:13:38 2013] BIOS-e820: [mem 0x00000000bf2f6000-0x00000000bf2f8fff] ACPI NVS
[Tue Sep 17 01:13:38 2013] BIOS-e820: [mem 0x00000000bf56d000-0x00000000bf574fff] ACPI NVS
[Tue Sep 17 01:13:38 2013] BIOS-e820: [mem 0x00000000bf59f000-0x00000000bf7a1fff] ACPI NVS
[Tue Sep 17 01:13:38 2013] ACPI: RSDP 00000000000f0450 00024 (v02 ALASKA)
[Tue Sep 17 01:13:38 2013] ACPI: XSDT 00000000bf235068 00054 (v01 ALASKA    A M I 01072009 AMI  00010013)
[Tue Sep 17 01:13:38 2013] ACPI: FACP 00000000bf23b7c8 000F4 (v04 ALASKA    A M I 01072009 AMI  00010013)
[Tue Sep 17 01:13:38 2013] ACPI BIOS Bug: Warning: Optional FADT field Pm2ControlBlock has zero address or length: 0x0000000000000000/0x1 (20120913/tbfadt-598)
[Tue Sep 17 01:13:38 2013] ACPI: DSDT 00000000bf235150 06671 (v02 ALASKA    A M I 00000000 INTL 20051117)
[Tue Sep 17 01:13:38 2013] ACPI: FACS 00000000bf574f80 00040
[Tue Sep 17 01:13:38 2013] ACPI: APIC 00000000bf23b8c0 00072 (v03 ALASKA    A M I 01072009 AMI  00010013)
[Tue Sep 17 01:13:38 2013] ACPI: MCFG 00000000bf23b938 0003C (v01 A M I  GMCH945. 01072009 MSFT 00000097)
[Tue Sep 17 01:13:38 2013] ACPI: HPET 00000000bf23b978 00038 (v01 ALASKA    A M I 01072009 AMI  00000005)
[Tue Sep 17 01:13:38 2013] ACPI: SSDT 00000000bf23b9b0 00FD8 (v01 AMD    POWERNOW 00000001 AMD  00000001)
[Tue Sep 17 01:13:38 2013] ACPI: SSDT 00000000bf23c988 00695 (v02    AMD     ALIB 00000001 MSFT 04000000)
[Tue Sep 17 01:13:38 2013] ACPI: Local APIC address 0xfee00000
[Tue Sep 17 01:13:38 2013] ACPI: PM-Timer IO Port: 0x808
[Tue Sep 17 01:13:38 2013] ACPI: Local APIC address 0xfee00000
[Tue Sep 17 01:13:38 2013] ACPI: LAPIC (acpi_id[0x01] lapic_id[0x00] enabled)
[Tue Sep 17 01:13:38 2013] ACPI: LAPIC (acpi_id[0x02] lapic_id[0x01] enabled)
[Tue Sep 17 01:13:38 2013] ACPI: LAPIC (acpi_id[0x03] lapic_id[0x02] enabled)
[Tue Sep 17 01:13:38 2013] ACPI: LAPIC (acpi_id[0x04] lapic_id[0x03] enabled)
[Tue Sep 17 01:13:38 2013] ACPI: LAPIC_NMI (acpi_id[0xff] high edge lint[0x1])
[Tue Sep 17 01:13:38 2013] ACPI: IOAPIC (id[0x05] address[0xfec00000] gsi_base[0])
[Tue Sep 17 01:13:38 2013] ACPI: INT_SRC_OVR (bus 0 bus_irq 0 global_irq 2 dfl dfl)
[Tue Sep 17 01:13:38 2013] ACPI: INT_SRC_OVR (bus 0 bus_irq 9 global_irq 9 low level)
[Tue Sep 17 01:13:38 2013] ACPI: IRQ0 used by override.
[Tue Sep 17 01:13:38 2013] ACPI: IRQ2 used by override.
[Tue Sep 17 01:13:38 2013] ACPI: IRQ9 used by override.
[Tue Sep 17 01:13:38 2013] Using ACPI (MADT) for SMP configuration information
[Tue Sep 17 01:13:38 2013] ACPI: HPET id: 0xffffffff base: 0xfed00000
[Tue Sep 17 01:13:38 2013] ACPI: Core revision 20120913
[Tue Sep 17 01:13:38 2013] PM: Registering ACPI NVS region [mem 0xbf1ec000-0xbf234fff] (299008 bytes)
[Tue Sep 17 01:13:38 2013] PM: Registering ACPI NVS region [mem 0xbf2f6000-0xbf2f8fff] (12288 bytes)
[Tue Sep 17 01:13:38 2013] PM: Registering ACPI NVS region [mem 0xbf56d000-0xbf574fff] (32768 bytes)
[Tue Sep 17 01:13:38 2013] PM: Registering ACPI NVS region [mem 0xbf59f000-0xbf7a1fff] (2109440 bytes)
[Tue Sep 17 01:13:38 2013] ACPI: bus type pci registered
[Tue Sep 17 01:13:38 2013] ACPI: Added _OSI(Module Device)
[Tue Sep 17 01:13:38 2013] ACPI: Added _OSI(Processor Device)
[Tue Sep 17 01:13:38 2013] ACPI: Added _OSI(3.0 _SCP Extensions)
[Tue Sep 17 01:13:38 2013] ACPI: Added _OSI(Processor Aggregator Device)
[Tue Sep 17 01:13:38 2013] ACPI: EC: Look up EC in DSDT
[Tue Sep 17 01:13:38 2013] ACPI: Executed 1 blocks of module-level executable AML code
[Tue Sep 17 01:13:38 2013] ACPI: Interpreter enabled
[Tue Sep 17 01:13:38 2013] ACPI: (supports S0 S3 S4 S5)
[Tue Sep 17 01:13:38 2013] ACPI: Using IOAPIC for interrupt routing
[Tue Sep 17 01:13:38 2013] ACPI: No dock devices found.
[Tue Sep 17 01:13:38 2013] PCI: Using host bridge windows from ACPI; if necessary, use "pci=nocrs" and report a bug
[Tue Sep 17 01:13:38 2013] ACPI: PCI Root Bridge [PCI0] (domain 0000 [bus 00-ff])
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Routing Table [\_SB_.PCI0._PRT]
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Routing Table [\_SB_.PCI0.P0PC._PRT]
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Routing Table [\_SB_.PCI0.BR14._PRT]
[Tue Sep 17 01:13:38 2013]  pci0000:00: Requesting ACPI _OSC control (0x1d)
[Tue Sep 17 01:13:38 2013]  pci0000:00: ACPI _OSC control (0x1d) granted
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN24] (IRQs *24)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN25] (IRQs *25)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN26] (IRQs *26)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN27] (IRQs *27)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN28] (IRQs *28)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN29] (IRQs *29)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN30] (IRQs *30)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN31] (IRQs *31)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN32] (IRQs *32)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN33] (IRQs *33)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN34] (IRQs *34)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN35] (IRQs *35)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN36] (IRQs *36)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN37] (IRQs *37)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN38] (IRQs *38)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN39] (IRQs *39)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN40] (IRQs *40)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN41] (IRQs *41)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN42] (IRQs *42)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN43] (IRQs *43)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN44] (IRQs *44)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN45] (IRQs *45)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN46] (IRQs *46)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN47] (IRQs *47)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN48] (IRQs *48)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN49] (IRQs *49)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN50] (IRQs *50)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN51] (IRQs *51)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN52] (IRQs *52)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN53] (IRQs *53)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN54] (IRQs *54)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LN55] (IRQs *55)
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LNKA] (IRQs 4 5 7 10 11 14 15) *0
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LNKB] (IRQs 4 5 7 10 11 14 15) *0
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LNKC] (IRQs 4 5 7 10 11 14 15) *0
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LNKD] (IRQs 4 5 7 10 11 14 15) *0
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LNKE] (IRQs 4 5 7 10 11 14 15) *0
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LNKF] (IRQs 4 5 7 10 11 14 15) *0
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LNKG] (IRQs 4 5 7 10 11 14 15) *0
[Tue Sep 17 01:13:38 2013] ACPI: PCI Interrupt Link [LNKH] (IRQs 4 5 7 10 11 14 15) *0
[Tue Sep 17 01:13:38 2013] ACPI: bus type scsi registered
[Tue Sep 17 01:13:38 2013] ACPI: bus type usb registered
[Tue Sep 17 01:13:38 2013] PCI: Using ACPI for IRQ routing
[Tue Sep 17 01:13:38 2013] pnp: PnP ACPI init
[Tue Sep 17 01:13:38 2013] ACPI: bus type pnp registered
[Tue Sep 17 01:13:38 2013] pnp 00:00: Plug and Play ACPI device, IDs PNP0a03 (active)
[Tue Sep 17 01:13:38 2013] system 00:01: Plug and Play ACPI device, IDs PNP0c01 (active)
[Tue Sep 17 01:13:38 2013] system 00:02: Plug and Play ACPI device, IDs PNP0c02 (active)
[Tue Sep 17 01:13:38 2013] system 00:03: Plug and Play ACPI device, IDs PNP0c02 (active)
[Tue Sep 17 01:13:38 2013] pnp 00:04: Plug and Play ACPI device, IDs PNP0303 PNP030b (active)
[Tue Sep 17 01:13:38 2013] pnp 00:05: Plug and Play ACPI device, IDs PNP0f03 PNP0f13 (active)
[Tue Sep 17 01:13:38 2013] pnp 00:06: Plug and Play ACPI device, IDs PNP0200 (active)
[Tue Sep 17 01:13:38 2013] pnp 00:07: Plug and Play ACPI device, IDs PNP0b00 (active)
[Tue Sep 17 01:13:38 2013] pnp 00:08: Plug and Play ACPI device, IDs PNP0800 (active)
[Tue Sep 17 01:13:38 2013] system 00:09: Plug and Play ACPI device, IDs PNP0c02 (active)
[Tue Sep 17 01:13:38 2013] pnp 00:0a: Plug and Play ACPI device, IDs PNP0c04 (active)
[Tue Sep 17 01:13:38 2013] system 00:0b: Plug and Play ACPI device, IDs PNP0c02 (active)
[Tue Sep 17 01:13:38 2013] pnp 00:0c: Plug and Play ACPI device, IDs PNP0103 (active)
[Tue Sep 17 01:13:38 2013] pnp: PnP ACPI: found 13 devices
[Tue Sep 17 01:13:38 2013] ACPI: ACPI bus type pnp unregistered
[Tue Sep 17 01:13:39 2013] ACPI: acpi_idle registered with cpuidle
[Tue Sep 17 01:13:42 2013] ACPI: Power Button [PWRB]
[Tue Sep 17 01:13:42 2013] ACPI: Power Button [PWRF]
[Tue Sep 17 01:13:42 2013] acpi-cpufreq: overriding BIOS provided _PSD data

--- snip ---

Vielleicht hat das ja etwas mit dem Reboot zu tun. Außerdem kann ich natürlich nach dem nächsten Reboot prüfen, ob da wieder kurz vorher
diese ganzen ACPI Meldungen stehen.

Des weiteren gibt's seit dem Reboot ca. 300 mal einen apparmor Fehler (der glaube ich nichts mit meinem Problem zu tun hatm, schön ist er aber trotzdem nicht)
Code:
[Tue Sep 17 14:28:17 2013] type=1400 audit(1379421001.139:100): apparmor="DENIED" operation="change_hat" info="unconfined" error=-1 pid=4612 comm="cron"


Und jetzt warte ich auf den nächsten Reboot. Danke

Klaus
 

spoensche

Moderator
Teammitglied
Code:
[Tue Sep 17 01:13:38 2013] ACPI BIOS Bug: Warning: Optional FADT field Pm2ControlBlock has zero address or length: 0x0000000000000000/0x1 (20120913/tbfadt-598)

Nicht gut. Der Pm2ControlBlock hat etwas mit dem Powermanagement zu tun. Allerdings muss er nicht der Auslöser für kurioses Verhalten deines Rechners sein. Es kommt dabei auch auf die Konfiguration des Powermanagements an. Aus Erfahrung kann ich aber beruhigen. Der Bug sieht zu 99% im Log blöd aus, hat aber keine gravierenderen Einfluss auf die Systemstabilität.

Die ACPI Meldungen sind nach jedem Reboot und nach jedem erneuten Einschalten des Rechners vorhanden. ACPI = Advanced Configuration Powermanagement.

Bezüglich der Meldung von den 128 MB reservierten Speicher für den Crashkernel kann ich dich beruhigen. Der Kernel reserviert sich 128MB für den Falle eines Falles, weil man mit kexec durchaus auch die Möglichkeit hat gezielt den Crashkernel zu booten und das Problem zu analysieren.

Hat der Befehl ausser den ACPI Meldungen nichts zu Tage gefördert?

Was für Hardware werkelt den bei dir?
 
OP
K

kzeitler

Newbie
spoensche schrieb:
Die ACPI Meldungen sind nach jedem Reboot und nach jedem erneuten Einschalten des Rechners vorhanden. ACPI = Advanced Configuration Powermanagement.
Aber in diesem Fall sind sie ja direkt vor dem Reboot gekommen. Mal sehen ob sie wieder unmittelbar vor dem nächsten reboot stehen.

spoensche schrieb:
Hat der Befehl ausser den ACPI Meldungen nichts zu Tage gefördert?
Ich habe noch ca 10 mal hintereinander folgendes gefunden:
Code:
[Tue Sep 17 01:13:42 2013] systemd-udevd[387]: failed to execute '/usr/lib/udev/socket:/org/xen/xend/udev_event' 'socket:/org/xen/xend/udev_event': No such file or directory

spoensche schrieb:
Was für Hardware werkelt den bei dir?
Hier ist der Output von hwinfo --short (oder brauchst Du mehr?):
--- snip ---
Code:
cpu:
                       AMD A6-3650 APU with Radeon(tm) HD Graphics, 2600 MHz
                       AMD A6-3650 APU with Radeon(tm) HD Graphics, 1800 MHz
                       AMD A6-3650 APU with Radeon(tm) HD Graphics, 2300 MHz
                       AMD A6-3650 APU with Radeon(tm) HD Graphics, 1600 MHz
keyboard:
  /dev/input/event0    AT Translated Set 2 keyboard
mouse:
  /dev/input/mice      Logitech USB Optical Mouse
graphics card:
                       ATI VGA compatible controller
sound:
                       ATI Audio device
                       AMD Audio device
storage:
                       AMD RAID bus controller
network:
  eth0                 Realtek RTL8111/8168B PCI Express Gigabit Ethernet controller
network interface:
  lo                   Loopback network interface
  eth0                 Ethernet network interface
disk:
  /dev/sda             Samsung SSD 840
  /dev/sdb             ST3000DM001-9YN1
  /dev/sdc             ST3000DM001-9YN1
  /dev/sdd             Generic SD/MMC
  /dev/sde             Generic Compact Flash
  /dev/sdf             Generic SM/xD-Picture
  /dev/sdg             Generic MS/MS-Pro
partition:
  /dev/sda1            Partition
  /dev/sda2            Partition
  /dev/sda3            Partition
  /dev/sdb1            Partition
  /dev/sdb2            Partition
cdrom:
  /dev/sr0             PIONEER DVD-RW  DVR-220
  /dev/sr1             HL-DT-ST DVDRAM GH24NS90
usb controller:
                       AMD USB Controller
                       AMD USB Controller
                       AMD USB Controller
                       AMD USB Controller
                       AMD USB Controller
                       AMD USB Controller
                       AMD USB Controller
bios:
                       BIOS
bridge:
                       AMD Host bridge
                       AMD PCI bridge
                       AMD ISA bridge
                       AMD PCI bridge
                       AMD Host bridge
                       AMD Host bridge
                       AMD Host bridge
                       AMD Host bridge
                       AMD Host bridge
                       AMD Host bridge
                       AMD Host bridge
                       AMD Host bridge
hub:
                       Linux 3.7.10-1.16-desktop ohci_hcd OHCI Host Controller
                       Linux 3.7.10-1.16-desktop ohci_hcd OHCI Host Controller
                       Linux 3.7.10-1.16-desktop ohci_hcd OHCI Host Controller
                       Linux 3.7.10-1.16-desktop xhci_hcd xHCI Host Controller
                       Linux 3.7.10-1.16-desktop xhci_hcd xHCI Host Controller
                       Linux 3.7.10-1.16-desktop ehci_hcd EHCI Host Controller
                       Linux 3.7.10-1.16-desktop xhci_hcd xHCI Host Controller
                       Linux 3.7.10-1.16-desktop ehci_hcd EHCI Host Controller
                       Linux 3.7.10-1.16-desktop xhci_hcd xHCI Host Controller
memory:
                       Main Memory
unknown:
                       FPU
                       DMA controller
                       PIC
                       Timer
                       Keyboard controller
                       AMD SMBus
                       AMD SD Host controller
                       Alcor Micro Mass Storage Device
--- snip ---


Ich habe vorhin nach einem 'zypper update' einen Reboot gemacht und dann mal mit dmesg geschaut, ob mir sonst noch etwas auffällt.
Mekwürdig find ich z.B. unmittelbar nach den ganzen ACPI Zeilen ca. 30 Zeilen wie etwa:
Code:
[Sat Sep 21 12:07:59 2013] PM: Registered nosave memory: 0000000000092000 - 0000000000093000
 

spoensche

Moderator
Teammitglied
Beim Posten von Befehlsausgaben o.ä bitte die
Code:
 Tags verwenden.

Die Meldung ...nosave memory....... ist normal. Es gibt reserved Memory, z.B. für ACPI, und ist nicht überschreibbar, da beim nächsten Boot nichts mehr funktionieren würde. Beim Powermanagement hingegen müssen die Adressen schreibbar sein, weil die Flags (z.B. C0 D3) für den State des PM gesetzt werden müssen. Daher auch nosave memory.

Hast du mal deinen RAM mit Memcheck überprüft?
 
OP
K

kzeitler

Newbie
spoensche schrieb:
Hast du mal deinen RAM mit Memcheck überprüft?
ja, das war das erste was ich versucht habe. memtest oder war's memtest86 hat
keinen Fehler angezeigt. Ich habe aber irgendwo gelesen, daß man sich da nicht
100% drauf verlassen kann.
Gibt's was besseres/anderes?
 

spoensche

Moderator
Teammitglied
kzeitler schrieb:
spoensche schrieb:
Hast du mal deinen RAM mit Memcheck überprüft?
ja, das war das erste was ich versucht habe. memtest oder war's memtest86 hat
keinen Fehler angezeigt. Ich habe aber irgendwo gelesen, daß man sich da nicht
100% drauf verlassen kann.
Gibt's was besseres/anderes?

Man kann sich schon darauf verlassen. Allerdings sollte man, wie bei jedem anderen RAM Tester auch, nicht sofort nach dem 1. Test den Test abbrechen und sagen der RAM sei in Ordnung.
Wenn du Memtest abends startest und bis zum nächsten morgen durchlaufen, dann lässt bist du auf der sicheren Seite.
 
OP
K

kzeitler

Newbie
Heute gab's wieder einen Restart um ca. 18:40. In /var/log/messages sieht man Die letzten Meldungen vor dem Crash um 18:30 und das war's dann:

Code:
2013-09-23T18:15:01.986740+02:00 lysmata /usr/sbin/cron[3044]: pam_unix(crond:session): session opened for user root by (uid=0)
2013-09-23T18:15:01.987561+02:00 lysmata kernel: [194403.301516] type=1400 audit(1379952901.985:266): apparmor="DENIED" operation="change_hat" info="unconfined" error=-1 pid=3044 comm="cron"
2013-09-23T18:15:01.987923+02:00 lysmata /usr/sbin/cron[3044]: pam_apparmor(crond:session): Unknown error occurred changing to root hat: Operation not permitted
2013-09-23T18:15:02.021151+02:00 lysmata /USR/SBIN/CRON[3044]: pam_unix(crond:session): session closed for user root
2013-09-23T18:30:01.035222+02:00 lysmata /usr/sbin/cron[3826]: pam_unix(crond:session): session opened for user root by (uid=0)
2013-09-23T18:30:01.035535+02:00 lysmata kernel: [195300.417895] type=1400 audit(1379953801.033:267): apparmor="DENIED" operation="change_hat" info="unconfined" error=-1 pid=3826 comm="cron"
2013-09-23T18:30:01.036530+02:00 lysmata /usr/sbin/cron[3826]: pam_apparmor(crond:session): Unknown error occurred changing to root hat: Operation not permitted
2013-09-23T18:30:01.069508+02:00 lysmata /USR/SBIN/CRON[3826]: pam_unix(crond:session): session closed for user root
2013-09-23T18:40:55.537536+02:00 lysmata rsyslogd: [origin software="rsyslogd" swVersion="7.2.7" x-pid="945" x-info="http://www.rsyslog.com"] start
2013-09-23T18:40:55.538141+02:00 lysmata kernel: [    0.000000] Initializing cgroup subsys cpuset
2013-09-23T18:40:55.538147+02:00 lysmata kernel: [    0.000000] Initializing cgroup subsys cpu
2013-09-23T18:40:55.538148+02:00 lysmata kernel: [    0.000000] Linux version 3.7.10-1.16-desktop (geeko@buildhost) (gcc version 4.7.2 20130108 [gcc-4_7-branch revision 195012] (SUSE Linux) ) #1 SMP PREEMPT Fri May 31 20:21:23 UTC 2013 (97c14ba)
2013-09-23T18:40:55.538177+02:00 lysmata kernel: [    0.000000] Command line: BOOT_IMAGE=/vmlinuz-3.7.10-1.16-desktop root=UUID=989b7d26-ee3e-4a28-9237-bdb7fdb713ae resume=/dev/disk/by-id/ata-Samsung_SSD_840_Series_S19HNEAD216775K-part2 splash=silent quiet showopts crashkernel=256M-:128M
2013-09-23T18:40:55.538178+02:00 lysmata kernel: [    0.000000] e820: BIOS-provided physical RAM map:
2013-09-23T18:40:55.538179+02:00 lysmata kernel: [    0.000000] BIOS-e820: [mem 0x0000000000000000-0x0000000000092bff] usable
2013-09-23T18:40:55.538180+02:00 lysmata kernel: [    0.000000] BIOS-e820: [mem 0x0000000000092c00-0x000000000009ffff] reserved
2013-09-23T18:40:55.538181+02:00 lysmata kernel: [    0.000000] BIOS-e820: [mem 0x00000000000e0000-0x00000000000fffff] reserved
2013-09-23T18:40:55.538181+02:00 lysmata kernel: [    0.000000] BIOS-e820: [mem 0x0000000000100000-0x00000000bb18bfff] usable
2013-09-23T18:40:55.538200+02:00 lysmata kernel: [    0.000000] BIOS-e820: [mem 0x00000000bf1ec000-0x00000000bf234fff] ACPI NVS
2013-09-23T18:40:55.538212+02:00 lysmata kernel: [    0.000000] BIOS-e820: [mem 0x00000000bf235000-0x00000000bf23dfff] ACPI data
2013-09-23T18:40:55.538213+02:00 lysmata kernel: [    0.000000] BIOS-e820: [mem 0x00000000bf23e000-0x00000000bf2f5fff] reserved

Und hier ist nochmal der Output von dmesg -T | egrep -i "err|warn|fail|fault|crit|acpi|apic":
Code:
[Mon Sep 23 18:39:57 2013] BIOS-e820: [mem 0x00000000bf1ec000-0x00000000bf234fff] ACPI NVS
[Mon Sep 23 18:39:57 2013] BIOS-e820: [mem 0x00000000bf235000-0x00000000bf23dfff] ACPI data
[Mon Sep 23 18:39:57 2013] BIOS-e820: [mem 0x00000000bf2f6000-0x00000000bf2f8fff] ACPI NVS
[Mon Sep 23 18:39:57 2013] BIOS-e820: [mem 0x00000000bf56d000-0x00000000bf574fff] ACPI NVS
[Mon Sep 23 18:39:57 2013] BIOS-e820: [mem 0x00000000bf59f000-0x00000000bf7a1fff] ACPI NVS
[Mon Sep 23 18:39:57 2013] MTRR default type: uncachable
[Mon Sep 23 18:39:57 2013] ACPI: RSDP 00000000000f0450 00024 (v02 ALASKA)
[Mon Sep 23 18:39:57 2013] ACPI: XSDT 00000000bf235068 00054 (v01 ALASKA    A M I 01072009 AMI  00010013)
[Mon Sep 23 18:39:57 2013] ACPI: FACP 00000000bf23b7c8 000F4 (v04 ALASKA    A M I 01072009 AMI  00010013)
[Mon Sep 23 18:39:57 2013] ACPI BIOS Bug: Warning: Optional FADT field Pm2ControlBlock has zero address or length: 0x0000000000000000/0x1 (20120913/tbfadt-598)
[Mon Sep 23 18:39:57 2013] ACPI: DSDT 00000000bf235150 06671 (v02 ALASKA    A M I 00000000 INTL 20051117)
[Mon Sep 23 18:39:57 2013] ACPI: FACS 00000000bf574f80 00040
[Mon Sep 23 18:39:57 2013] ACPI: APIC 00000000bf23b8c0 00072 (v03 ALASKA    A M I 01072009 AMI  00010013)
[Mon Sep 23 18:39:57 2013] ACPI: MCFG 00000000bf23b938 0003C (v01 A M I  GMCH945. 01072009 MSFT 00000097)
[Mon Sep 23 18:39:57 2013] ACPI: HPET 00000000bf23b978 00038 (v01 ALASKA    A M I 01072009 AMI  00000005)
[Mon Sep 23 18:39:57 2013] ACPI: SSDT 00000000bf23b9b0 00FD8 (v01 AMD    POWERNOW 00000001 AMD  00000001)
[Mon Sep 23 18:39:57 2013] ACPI: SSDT 00000000bf23c988 00695 (v02    AMD     ALIB 00000001 MSFT 04000000)
[Mon Sep 23 18:39:57 2013] ACPI: Local APIC address 0xfee00000
[Mon Sep 23 18:39:57 2013] ACPI: PM-Timer IO Port: 0x808
[Mon Sep 23 18:39:57 2013] ACPI: Local APIC address 0xfee00000
[Mon Sep 23 18:39:57 2013] ACPI: LAPIC (acpi_id[0x01] lapic_id[0x00] enabled)
[Mon Sep 23 18:39:57 2013] ACPI: LAPIC (acpi_id[0x02] lapic_id[0x01] enabled)
[Mon Sep 23 18:39:57 2013] ACPI: LAPIC (acpi_id[0x03] lapic_id[0x02] enabled)
[Mon Sep 23 18:39:57 2013] ACPI: LAPIC (acpi_id[0x04] lapic_id[0x03] enabled)
[Mon Sep 23 18:39:57 2013] ACPI: LAPIC_NMI (acpi_id[0xff] high edge lint[0x1])
[Mon Sep 23 18:39:57 2013] ACPI: IOAPIC (id[0x05] address[0xfec00000] gsi_base[0])
[Mon Sep 23 18:39:57 2013] IOAPIC[0]: apic_id 5, version 33, address 0xfec00000, GSI 0-23
[Mon Sep 23 18:39:57 2013] ACPI: INT_SRC_OVR (bus 0 bus_irq 0 global_irq 2 dfl dfl)
[Mon Sep 23 18:39:57 2013] ACPI: INT_SRC_OVR (bus 0 bus_irq 9 global_irq 9 low level)
[Mon Sep 23 18:39:57 2013] ACPI: IRQ0 used by override.
[Mon Sep 23 18:39:57 2013] ACPI: IRQ2 used by override.
[Mon Sep 23 18:39:57 2013] ACPI: IRQ9 used by override.
[Mon Sep 23 18:39:57 2013] Using ACPI (MADT) for SMP configuration information
[Mon Sep 23 18:39:57 2013] ACPI: HPET id: 0xffffffff base: 0xfed00000
[Mon Sep 23 18:39:57 2013] spurious 8259A interrupt: IRQ7.
[Mon Sep 23 18:39:57 2013] pid_max: default: 32768 minimum: 301
[Mon Sep 23 18:39:57 2013] ACPI: Core revision 20120913
[Mon Sep 23 18:39:57 2013] ..TIMER: vector=0x30 apic1=0 pin1=2 apic2=-1 pin2=-1
[Mon Sep 23 18:39:57 2013] PM: Registering ACPI NVS region [mem 0xbf1ec000-0xbf234fff] (299008 bytes)
[Mon Sep 23 18:39:57 2013] PM: Registering ACPI NVS region [mem 0xbf2f6000-0xbf2f8fff] (12288 bytes)
[Mon Sep 23 18:39:57 2013] PM: Registering ACPI NVS region [mem 0xbf56d000-0xbf574fff] (32768 bytes)
[Mon Sep 23 18:39:57 2013] PM: Registering ACPI NVS region [mem 0xbf59f000-0xbf7a1fff] (2109440 bytes)
[Mon Sep 23 18:39:57 2013] ACPI: bus type pci registered
[Mon Sep 23 18:39:57 2013] ACPI: Added _OSI(Module Device)
[Mon Sep 23 18:39:57 2013] ACPI: Added _OSI(Processor Device)
[Mon Sep 23 18:39:57 2013] ACPI: Added _OSI(3.0 _SCP Extensions)
[Mon Sep 23 18:39:57 2013] ACPI: Added _OSI(Processor Aggregator Device)
[Mon Sep 23 18:39:57 2013] ACPI: EC: Look up EC in DSDT
[Mon Sep 23 18:39:57 2013] ACPI: Executed 1 blocks of module-level executable AML code
[Mon Sep 23 18:39:57 2013] ACPI: Interpreter enabled
[Mon Sep 23 18:39:57 2013] ACPI: (supports S0 S3 S4 S5)
[Mon Sep 23 18:39:57 2013] ACPI: Using IOAPIC for interrupt routing
[Mon Sep 23 18:39:57 2013] ACPI: No dock devices found.
[Mon Sep 23 18:39:57 2013] PCI: Using host bridge windows from ACPI; if necessary, use "pci=nocrs" and report a bug
[Mon Sep 23 18:39:57 2013] ACPI: PCI Root Bridge [PCI0] (domain 0000 [bus 00-ff])
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Routing Table [\_SB_.PCI0._PRT]
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Routing Table [\_SB_.PCI0.P0PC._PRT]
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Routing Table [\_SB_.PCI0.BR14._PRT]
[Mon Sep 23 18:39:57 2013]  pci0000:00: Requesting ACPI _OSC control (0x1d)
[Mon Sep 23 18:39:57 2013]  pci0000:00: ACPI _OSC control (0x1d) granted
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN24] (IRQs *24)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN25] (IRQs *25)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN26] (IRQs *26)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN27] (IRQs *27)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN28] (IRQs *28)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN29] (IRQs *29)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN30] (IRQs *30)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN31] (IRQs *31)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN32] (IRQs *32)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN33] (IRQs *33)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN34] (IRQs *34)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN35] (IRQs *35)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN36] (IRQs *36)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN37] (IRQs *37)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN38] (IRQs *38)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN39] (IRQs *39)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN40] (IRQs *40)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN41] (IRQs *41)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN42] (IRQs *42)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN43] (IRQs *43)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN44] (IRQs *44)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN45] (IRQs *45)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN46] (IRQs *46)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN47] (IRQs *47)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN48] (IRQs *48)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN49] (IRQs *49)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN50] (IRQs *50)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN51] (IRQs *51)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN52] (IRQs *52)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN53] (IRQs *53)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN54] (IRQs *54)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LN55] (IRQs *55)
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LNKA] (IRQs 4 5 7 10 11 14 15) *0
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LNKB] (IRQs 4 5 7 10 11 14 15) *0
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LNKC] (IRQs 4 5 7 10 11 14 15) *0
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LNKD] (IRQs 4 5 7 10 11 14 15) *0
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LNKE] (IRQs 4 5 7 10 11 14 15) *0
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LNKF] (IRQs 4 5 7 10 11 14 15) *0
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LNKG] (IRQs 4 5 7 10 11 14 15) *0
[Mon Sep 23 18:39:57 2013] ACPI: PCI Interrupt Link [LNKH] (IRQs 4 5 7 10 11 14 15) *0
[Mon Sep 23 18:39:57 2013] ACPI: bus type scsi registered
[Mon Sep 23 18:39:57 2013] ACPI: bus type usb registered
[Mon Sep 23 18:39:57 2013] PCI: Using ACPI for IRQ routing
[Mon Sep 23 18:39:57 2013] NetLabel:  unlabeled traffic allowed by default
[Mon Sep 23 18:39:57 2013] pnp: PnP ACPI init
[Mon Sep 23 18:39:57 2013] ACPI: bus type pnp registered
[Mon Sep 23 18:39:57 2013] pnp 00:00: Plug and Play ACPI device, IDs PNP0a03 (active)
[Mon Sep 23 18:39:57 2013] system 00:01: Plug and Play ACPI device, IDs PNP0c01 (active)
[Mon Sep 23 18:39:57 2013] system 00:02: Plug and Play ACPI device, IDs PNP0c02 (active)
[Mon Sep 23 18:39:57 2013] system 00:03: Plug and Play ACPI device, IDs PNP0c02 (active)
[Mon Sep 23 18:39:57 2013] pnp 00:04: Plug and Play ACPI device, IDs PNP0303 PNP030b (active)
[Mon Sep 23 18:39:57 2013] pnp 00:05: Plug and Play ACPI device, IDs PNP0f03 PNP0f13 (active)
[Mon Sep 23 18:39:57 2013] pnp 00:06: Plug and Play ACPI device, IDs PNP0200 (active)
[Mon Sep 23 18:39:57 2013] pnp 00:07: Plug and Play ACPI device, IDs PNP0b00 (active)
[Mon Sep 23 18:39:57 2013] pnp 00:08: Plug and Play ACPI device, IDs PNP0800 (active)
[Mon Sep 23 18:39:57 2013] system 00:09: Plug and Play ACPI device, IDs PNP0c02 (active)
[Mon Sep 23 18:39:57 2013] pnp 00:0a: Plug and Play ACPI device, IDs PNP0c04 (active)
[Mon Sep 23 18:39:57 2013] system 00:0b: Plug and Play ACPI device, IDs PNP0c02 (active)
[Mon Sep 23 18:39:57 2013] pnp 00:0c: Plug and Play ACPI device, IDs PNP0103 (active)
[Mon Sep 23 18:39:57 2013] pnp: PnP ACPI: found 13 devices
[Mon Sep 23 18:39:57 2013] ACPI: ACPI bus type pnp unregistered
[Mon Sep 23 18:39:57 2013] PCI: CLS 64 bytes, default 64
[Mon Sep 23 18:39:57 2013] io scheduler cfq registered (default)
[Mon Sep 23 18:39:57 2013] pcieport 0000:00:04.0: Signaling PME through PCIe PME interrupt
[Mon Sep 23 18:39:57 2013] pci 0000:01:00.0: Signaling PME through PCIe PME interrupt
[Mon Sep 23 18:39:58 2013] ACPI: acpi_idle registered with cpuidle
[Mon Sep 23 18:39:58 2013] [drm] radeon defaulting to kernel modesetting.
[Mon Sep 23 18:40:00 2013] systemd[1]: Starting LSB: Set default boot entry if called...
[Mon Sep 23 18:40:00 2013] systemd[1]: Started LSB: Set default boot entry if called.
[Mon Sep 23 18:40:00 2013] ACPI: Power Button [PWRB]
[Mon Sep 23 18:40:00 2013] ACPI: Power Button [PWRF]
[Mon Sep 23 18:40:00 2013] systemd-udevd[403]: failed to execute '/usr/lib/udev/socket:/org/xen/xend/udev_event' 'socket:/org/xen/xend/udev_event': No such file or directory
[Mon Sep 23 18:40:00 2013] systemd-udevd[405]: failed to execute '/usr/lib/udev/socket:/org/xen/xend/udev_event' 'socket:/org/xen/xend/udev_event': No such file or directory
[Mon Sep 23 18:40:00 2013] sdhci: Copyright(c) Pierre Ossman
[Mon Sep 23 18:40:00 2013] systemd-udevd[445]: failed to execute '/usr/lib/udev/socket:/org/xen/xend/udev_event' 'socket:/org/xen/xend/udev_event': No such file or directory
[Mon Sep 23 18:40:00 2013] systemd-udevd[443]: failed to execute '/usr/lib/udev/socket:/org/xen/xend/udev_event' 'socket:/org/xen/xend/udev_event': No such file or directory
[Mon Sep 23 18:40:00 2013] systemd-udevd[425]: failed to execute '/usr/lib/udev/socket:/org/xen/xend/udev_event' 'socket:/org/xen/xend/udev_event': No such file or directory
[Mon Sep 23 18:40:00 2013] systemd-udevd[450]: failed to execute '/usr/lib/udev/socket:/org/xen/xend/udev_event' 'socket:/org/xen/xend/udev_event': No such file or directory
[Mon Sep 23 18:40:00 2013] systemd-udevd[436]: failed to execute '/usr/lib/udev/socket:/org/xen/xend/udev_event' 'socket:/org/xen/xend/udev_event': No such file or directory
[Mon Sep 23 18:40:00 2013] systemd-udevd[451]: failed to execute '/usr/lib/udev/socket:/org/xen/xend/udev_event' 'socket:/org/xen/xend/udev_event': No such file or directory
[Mon Sep 23 18:40:00 2013] systemd-udevd[452]: failed to execute '/usr/lib/udev/socket:/org/xen/xend/udev_event' 'socket:/org/xen/xend/udev_event': No such file or directory
[Mon Sep 23 18:40:00 2013] ALSA patch_realtek.c:1250 SKU: override=0x1
[Mon Sep 23 18:40:00 2013] acpi-cpufreq: overriding BIOS provided _PSD data
[Mon Sep 23 18:40:54 2013] type=1400 audit(1379954455.019:8): apparmor="STATUS" operation="profile_load" name="/usr/lib/apache2/mpm-prefork/apache2//DEFAULT_URI" pid=812 comm="apparmor_parser"
[Mon Sep 23 18:41:02 2013] [drm:radeon_cs_ioctl] *ERROR* Failed to parse relocation -12!
[Mon Sep 23 18:41:29 2013] type=1400 audit(1379954489.394:45): apparmor="DENIED" operation="change_hat" info="unconfined" error=-1 pid=1606 comm="gdm-session-wor"
[Mon Sep 23 18:45:01 2013] type=1400 audit(1379954701.816:46): apparmor="DENIED" operation="change_hat" info="unconfined" error=-1 pid=2455 comm="cron"



Leider immer noch kein Crash Dump in /var/crash. Was kann ich noch tun?
Den memtest laß ich demnächst noch mal laufen.
 

spoensche

Moderator
Teammitglied
Code:
[Mon Sep 23 18:40:00 2013] systemd-udevd[403]: failed to execute '/usr/lib/udev/socket:/org/xen/xend/udev_event' 'socket:/org/xen/xend/udev_event': No such file or directory
[Mon Sep 23 18:40:00 2013] systemd-udevd[405]: failed to execute '/usr/lib/udev/socket:/org/xen/xend/udev_event' 'socket:/org/xen/xend/udev_event': No such file or directory
[Mon Sep 23 18:40:00 2013] sdhci: Copyright(c) Pierre Ossman
[Mon Sep 23 18:40:00 2013] systemd-udevd[445]: failed to execute '/usr/lib/udev/socket:/org/xen/xend/udev_event' 'socket:/org/xen/xend/udev_event': No such file or directory
[Mon Sep 23 18:40:00 2013] systemd-udevd[443]: failed to execute '/usr/lib/udev/socket:/org/xen/xend/udev_event' 'socket:/org/xen/xend/udev_event': No such file or directory
[Mon Sep 23 18:40:00 2013] systemd-udevd[425]: failed to execute '/usr/lib/udev/socket:/org/xen/xend/udev_event' 'socket:/org/xen/xend/udev_event': No such file or directory
[Mon Sep 23 18:40:00 2013] systemd-udevd[450]: failed to execute '/usr/lib/udev/socket:/org/xen/xend/udev_event' 'socket:/org/xen/xend/udev_event': No such file or directory
[Mon Sep 23 18:40:00 2013] systemd-udevd[436]: failed to execute '/usr/lib/udev/socket:/org/xen/xend/udev_event' 'socket:/org/xen/xend/udev_event': No such file or directory
[Mon Sep 23 18:40:00 2013] systemd-udevd[451]: failed to execute '/usr/lib/udev/socket:/org/xen/xend/udev_event' 'socket:/org/xen/xend/udev_event': No such file or directory
[Mon Sep 23 18:40:00 2013] systemd-udevd[452]: failed to execute '/usr/lib/udev/socket:/org/xen/xend/udev_event' 'socket:/org/xen/xend/udev_event': No such file or directory

Hast du Xen bei dir am laufen und verwendest du ihn auch?

Code:
[Mon Sep 23 18:41:02 2013] [drm:radeon_cs_ioctl] *ERROR* Failed to parse relocation -12!

Und hier liegt die Ursache für die Abstürze und das ist ein Bug.
Siehe: http://lists.opensuse.org/opensuse-bugs/2013-06/msg02693.html
 
OP
K

kzeitler

Newbie
spoensche schrieb:
Hast du Xen bei dir am laufen und verwendest du ihn auch?
Sagt mir erst mal gar nichts (muß erst mal etwas Docu lesen, was das überhaupt ist, mit Virtualisierung hab ich mich noch gar nicht beschäftigt).
Jedenfalls sehe ich in den System Services:
xencommons Yes
xend Yes
xendomains Yes
Mit "ps -ef | grep xen" finde ich aber nichts. Ich vermute mal ich sollte die Services abstellen (bin mir sicher, daß ich sie nicht eingeschaltet habe).

kzeitler schrieb:
Code: Alles auswählen
[Mon Sep 23 18:41:02 2013] [drm:radeon_cs_ioctl] *ERROR* Failed to parse relocation -12!

spoensche schrieb:
Und hier liegt die Ursache für die Abstürze und das ist ein Bug.
Siehe: http://lists.opensuse.org/opensuse-bugs ... 02693.html

Dieser Fehler kommt ja direkt beim Neustart und ich sehe noch nicht so recht den Zusammenhang mit einem Reboot nach mehreren Tagen, aber ich kann nächste Woche mal
versuchen das xf86-video-ati.rpm Paket zu installieren.
 

spoensche

Moderator
Teammitglied
kzeitler schrieb:
spoensche schrieb:
Hast du Xen bei dir am laufen und verwendest du ihn auch?
Sagt mir erst mal gar nichts (muß erst mal etwas Docu lesen, was das überhaupt ist, mit Virtualisierung hab ich mich noch gar nicht beschäftigt).
Jedenfalls sehe ich in den System Services:
xencommons Yes
xend Yes
xendomains Yes
Mit "ps -ef | grep xen" finde ich aber nichts. Ich vermute mal ich sollte die Services abstellen (bin mir sicher, daß ich sie nicht eingeschaltet habe).

Deaktiviere sie.

kzeitler schrieb:
Code: Alles auswählen
[Mon Sep 23 18:41:02 2013] [drm:radeon_cs_ioctl] *ERROR* Failed to parse relocation -12!


spoensche schrieb:
Und hier liegt die Ursache für die Abstürze und das ist ein Bug.
Siehe: http://lists.opensuse.org/opensuse-bugs ... 02693.html

Dieser Fehler kommt ja direkt beim Neustart und ich sehe noch nicht so recht den Zusammenhang mit einem Reboot nach mehreren Tagen, aber ich kann nächste Woche mal
versuchen das xf86-video-ati.rpm Paket zu installieren.

Ein Reboot ist ein Neustart, egal ob jetzt oder erst übermorgen. Der Treiber ruft die Funktion ioctl (IO Ctrl. wird z.B. für den Aufruf von GPU Funktionen verweendet) auf. Das relocation deutet auf eine Operation hin, bei der ein Teil der Daten in einen anderen Addressbereichs des VRAM verschoben wird. Es kann sich dabei z.B. um den Transfer des Inhalts der GPU Register in den VRAM handeln.
 

SUSEDJAlex

Advanced Hacker
man kann überprüfen ob der Dienst bzw. der Service eingeschaltet ist.

Man tippt in einer Konsole ein: ( als Beispiel führe ich den ACPI an )

Code:
systemctl status acpid.service

dann sollte er ausgeben ob das aktiv ist oder nicht und welche Aktionen seit dem Start gelaufen ist

Hier die Ausgabe im Fall des ACPI:

Code:
systemctl status acpid.service
acpid.service - ACPI Event Daemon
          Loaded: loaded (/usr/lib/systemd/system/acpid.service; enabled)
          Active: active (running) since Thu, 2013-10-03 00:38:16 CEST; 1h 9min ago
        Main PID: 614 (acpid)
          CGroup: name=systemd:/system/acpid.service
                  └ 614 /usr/sbin/acpid -n -f

Oct 03 00:38:16 linux-n610.site systemd[1]: Started ACPI Event Daemon.
Oct 03 00:38:16 linux-n610.site acpid[614]: starting up with netlink and the input layer
Oct 03 00:38:16 linux-n610.site acpid[614]: 2 rules loaded
Oct 03 00:38:16 linux-n610.site acpid[614]: waiting for events: event logging is off
Oct 03 00:38:22 linux-n610.site acpid[614]: client connected from 999[0:0]
Oct 03 00:38:22 linux-n610.site acpid[614]: 1 client rule loaded
Oct 03 00:38:24 linux-n610.site acpid[614]: client connected from 999[0:0]
Oct 03 00:38:24 linux-n610.site acpid[614]: 1 client rule loaded

so kannst du mit Hilfe von systemctl auch den XEN-Service prüfen ob er aktiv ist oder nicht

LG SUSEDJAlex
 
OP
K

kzeitler

Newbie
Also mit der Zen Virtualisierung hatte es nichts zu tun. Xen habe ich abgeklemmt, aber diese Woche gab's wieder einen Reboot.
Als nächsten Schritt habe ich jetzt, wie vorgeschlagen, den Radeon Video Treiber durch Version 7.1.0-30.home_olh_12_3.1
ersetzt. Aber ich glaube das wird auch nichts helfen, denn die Zeile
Code:
2013-10-20T16:40:38.438375+02:00 lysmata kernel: [   12.358644] [drm:radeon_cs_ioctl] *ERROR* Failed to parse relocation -12!
ist immer noch da. Ich vermute mal, daß ich in einigen Tagen (meist 7-10) meinen nächsten sporadischen Reboot haben werde.

Als nächstes plane ich dann das Netzteil auszutauschen.
 

spoensche

Moderator
Teammitglied
Wenn du den Rechner bootest, dann trag im Bootmenü im Feld Bootoptionen mal folgendes ein:
Code:
radeon.aspm=0 drm.debug=1 pcie_aspm=0
und boote den Rechner.
Anschließend posteste du bitte die vollständige Ausgabe von
Code:
dmesg
und stellst sie z.B, bei pastebin.com ein und den Link postest du hier.


Wegen des aktivierten Debugging für das drm Modul solltest du deinen Festplattenplatz im Auge behalten.
 
OP
K

kzeitler

Newbie
Wie erwartet gab's diese Woche wieder einen Reboot. Ich habe jetzt mal beim boot die Parameter
Code:
radeon.aspm=0 drm.debug=1 pcie_aspm=0
eingegeben und die dmesg Ausgabe auf /pastebin eingestellt: http://pastebin.com/8ZYjZknq
 

spoensche

Moderator
Teammitglied
Die Ursache der Abstürze ist der BIOS Bug und der Bug im Radeon Treiber. Das Resultat ist ein nicht korrekt funktionierendes Powermanagement.
 
Oben