• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

Data Parity Error Detected during address or write data phas

chappert

Hacker
Hy ich nutze SuSe 11.1
und bekomme in der /var/log/messages immer folgende Meldung
kernel: scsi2: Data Parity Error Detected during address or write data phase

nach einem Tag hängt sich die Kiste auch komplett auf...
womit hängt das zusammen und wie kann man es lösen????

anbei mal die letzten Meldungen nach einem Bootvorgang in der diese Meldung auch auftritt


Code:
Nov  9 10:02:11 Roy SuSEfirewall2: Setting up rules from /etc/sysconfig/SuSEfirewall2 ...
Nov  9 10:02:11 Roy SuSEfirewall2: Warning: no default firewall zone defined, assuming 'ext'
Nov  9 10:02:13 Roy SuSEfirewall2: batch committing...
Nov  9 10:02:13 Roy SuSEfirewall2: Firewall rules successfully set
Nov  9 10:02:13 Roy kernel: bootsplash: status on console 0 changed to on
Nov  9 10:02:17 Roy kernel: st0: Block limits 1 - 16777215 bytes.
Nov  9 10:02:17 Roy kernel: scsi target2:0:5: FAST-10 WIDE SCSI 20.0 MB/s ST (100 ns, offset 15)
Nov  9 10:08:32 Roy sshd[4264]: Accepted keyboard-interactive/pam for root from 192.168.1.13 port 50697 ssh2
Nov  9 10:09:10 Roy kernel: scsi2: PCI error Interrupt at seqaddr = 0x9
Nov  9 10:09:10 Roy kernel: scsi2: Data Parity Error Detected during address or write data phase
Nov  9 10:10:19 Roy su: (to nobody) root on none
Nov  9 10:32:07 Roy smartd[3342]: Device: /dev/sdb [SAT], SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 110 to 111
Nov  9 10:32:07 Roy smartd[3342]: Device: /dev/sdb [SAT], SMART Usage Attribute: 190 Airflow_Temperature_Cel changed from 58 to 57
Nov  9 10:32:07 Roy smartd[3342]: Device: /dev/sdb [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 42 to 43
Nov  9 10:32:07 Roy smartd[3342]: Device: /dev/sdb [SAT], SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 60 to 59
 

lOtz1009

Moderator
Teammitglied
Da würde ich mal schleunigst ein Backup machen und ein Tool vom Hersteller drüberlaufen lassen (kompletten Oberflächentest durchführen).
 
OP
C

chappert

Hacker
kann ich herausfinden was für eine platte drin ist ohne den rechner auseinander zu bauen???
 
OP
C

chappert

Hacker
thx dann such ich ma nen tool vom hersteller wenns probleme gibt meld ich mich gleich nochmal :)
 
OP
C

chappert

Hacker
und schon gehts los ich hab folgende HDD im System (Model: "MAXTOR STM332082")

auf www.maxtor.com/de/ heist es das die jetzt zu seagate gehören und dort find ich für Maxtor Festplatten und für Linux kein Diagnose Programm, was mach ich jetzt...
 

lOtz1009

Moderator
Teammitglied
Normal gibts von den Herstellern Bootimages mit den Tools drauf. Oder schau mal kurz bei www.ultimatebootcd.com nach, ob bei der was dabei ist.
 
A

Anonymous

Gast
In den log-Auszug sehe ich das da ein Bandlaufwerk am SCSI angeschlossen ist und es auch wohl mehr als eine Platte im Rechner gibt. Ob das der selbe SCSI-Bus ist oder nicht ? Bei einer 320 Platte sollte es sich wahrscheinlich weniger um echte SCSI-Platte handeln also wohl (S)ATA, das Bandlaufwerk hängt folglich an einem anderem Kontroller.
"FAST-10 WIDE SCSI " stellt sich natürlich bei solchen Fehlern als erstes die Frage nach der sauberen Termination und ist das Problem schon älter oder hast du letztens am Rechner physikalisch rumgebaut.

Gib uns doch mal eine Übersicht was da vom SCSI überhaupt alles gefunden wird.
Code:
cat /proc/scsi/scsi

robi
 
OP
C

chappert

Hacker
rumgebastelt hab ich in letzter Zeit eigentlich nicht an dem Gerät, das letze woran ich mich erinnern kann ist das ich mal dat Netzteil gewechselt hatte aber das hat damit wohl eher nix zu tun.

hier der geforderte ausschnitt

cat /proc/scsi/scsi
Code:
cat /proc/scsi/scsi
Attached devices:
Host: scsi0 Channel: 00 Id: 00 Lun: 00
  Vendor: ATA      Model: ExcelStor Techno Rev: P21O
  Type:   Direct-Access                    ANSI  SCSI revision: 05
Host: scsi0 Channel: 00 Id: 01 Lun: 00
  Vendor: ATA      Model: MAXTOR STM332082 Rev: 3.AA
  Type:   Direct-Access                    ANSI  SCSI revision: 05
Host: scsi1 Channel: 00 Id: 00 Lun: 00
  Vendor: SAMSUNG  Model: CDRW/DVD SM-352B Rev: T801
  Type:   CD-ROM                           ANSI  SCSI revision: 05
Host: scsi2 Channel: 00 Id: 01 Lun: 00
  Vendor: CERTANCE Model: ULTRIUM 2        Rev: 1914
  Type:   Sequential-Access                ANSI  SCSI revision: 03
Host: scsi2 Channel: 00 Id: 01 Lun: 01
  Vendor: DELL     Model: PV-124T          Rev: 0043
  Type:   Medium Changer                   ANSI  SCSI revision: 02
Host: scsi2 Channel: 00 Id: 05 Lun: 00
  Vendor: BNCHMARK Model: DLT1             Rev: 5538
  Type:   Sequential-Access                ANSI  SCSI revision: 02

und hier nochmal dat komplette hwinfo --disk
Code:
hwinfo --disk
12: IDE 00.0: 10600 Disk
  [Created at block.243]
  UDI: /org/freedesktop/Hal/devices/storage_serial_SATA_ExcelStor_Techn_PV5201Q5913LQB
  Unique ID: 3OOL.nXsNQoVRC49
  Parent ID: ESW+.mcsZ0a690T4
  SysFS ID: /class/block/sda
  SysFS BusID: 0:0:0:0
  SysFS Device Link: /devices/pci0000:00/0000:00:07.1/host0/target0:0:0/0:0:0:0
  Hardware Class: disk
  Model: "ExcelStor Techno"
  Vendor: "ExcelStor"
  Device: "Techno"
  Revision: "P21O"
  Serial ID: "PV5201Q5913LQB"
  Driver: "pata_via", "sd"
  Driver Modules: "pata_via"
  Device File: /dev/sda
  Device Files: /dev/sda, /dev/disk/by-id/scsi-SATA_ExcelStor_Techn_PV5201Q5913LQB, /dev/disk/by-id/ata-ExcelStor_Technology_J8080_PV5201Q5913LQB, /dev/disk/by-path/pci-0000:00:07.1-scsi-0:0:0:0, /dev/disk/by-id/edd-int13_dev80
  Device Number: block 8:0-8:15
  BIOS id: 0x80
  Geometry (Logical): CHS 10011/255/63
  Size: 160836480 sectors a 512 bytes
  Geometry (BIOS EDD): CHS 39420/16/255
  Size (BIOS EDD): 160836480 sectors
  Geometry (BIOS Legacy): CHS 1024/255/63
  Config Status: cfg=no, avail=yes, need=no, active=unknown
  Attached to: #5 (IDE interface)

13: IDE 01.0: 10600 Disk
  [Created at block.243]
  UDI: /org/freedesktop/Hal/devices/storage_serial_SATA_MAXTOR_STM33208_9QF6XBDH
  Unique ID: WZeP.KWf+SZNObB9
  Parent ID: ESW+.mcsZ0a690T4
  SysFS ID: /class/block/sdb
  SysFS BusID: 0:0:1:0
  SysFS Device Link: /devices/pci0000:00/0000:00:07.1/host0/target0:0:1/0:0:1:0
  Hardware Class: disk
  Model: "MAXTOR STM332082"
  Vendor: "MAXTOR"
  Device: "STM332082"
  Revision: "3.AA"
  Serial ID: "9QF6XBDH"
  Driver: "pata_via", "sd"
  Driver Modules: "pata_via"
  Device File: /dev/sdb
  Device Files: /dev/sdb, /dev/disk/by-id/scsi-SATA_MAXTOR_STM33208_9QF6XBDH, /dev/disk/by-id/ata-MAXTOR_STM3320820A_9QF6XBDH, /dev/disk/by-path/pci-0000:00:07.1-scsi-0:0:1:0, /dev/disk/by-id/edd-int13_dev81
  Device Number: block 8:16-8:31
  BIOS id: 0x81
  Geometry (Logical): CHS 38913/255/63
  Size: 625142448 sectors a 512 bytes
  Geometry (BIOS EDD): CHS 153221/16/255
  Size (BIOS EDD): 625142448 sectors
  Geometry (BIOS Legacy): CHS 1024/255/63
  Config Status: cfg=no, avail=yes, need=no, active=unknown
  Attached to: #5 (IDE interface)
 
A

Anonymous

Gast
Wie ich das sehe hat der SCSI-Kontroller , welcher ? ein Problem am BUS mit den beiden Laufwerken. Ein LVD und ein SE Laufwerk an einem Bus :irre: für den hausgebrauch gerade noch vertretbar bei einem produktiven Servern in der "Profi-Liga" strikt abzuraten und wahrscheinlich von den Herstellern auch so nicht freigegeben und nicht supportet. Was hast du denn dort für einen Terminator und wie ist die Verkabelung an diesem Bus genau gelegt.

Sollte so hier so aussehen.

Controller (Autotermination on) <------- max 30cm ------> LW SE <----- max 30cm -----> LW LVD <--- max 10cm -->Terminator SE

Sind hier noch SCSI-Anschluss-Konverter dazwischen dann rechne pro Steckverbindung nochmal 15cm ab.
Terminator sollte in diesem Fall dringend ein "aktiver SE" und kein "SE-LVD-Kombi"
Häng mal den LTO Wechsler ab und schau mal ob dann diese Fehler immer noch kommen.

robi
 
OP
C

chappert

Hacker
ok ich werd das mal testen und mich dann wieder melden, kann allerdings ein wenig dauern...
danke schon mal für die hilfe bis hier her

allerdings würde ich gern wissen was du mit LVD bzw. SE Laufwerk meinst??? solche Bezeichnungen finde ich nicht...
 
A

Anonymous

Gast
chappert schrieb:
allerdings würde ich gern wissen was du mit LVD bzw. SE Laufwerk meinst??? solche Bezeichnungen finde ich nicht...
Das ist die physikalische Übertragungstechnik auf dem SCSi-BUS ( die Definition der elektischen Signalpegel )
SE = Single Ended SCSI
LVD = Low Voltage Differential
Beide sind Übertragungstechniken sind nur bedingt kompatibel an einem Bus. Daneben gibt es noch andere physikalischen Übertragungstechniken wie zB DF (Differential-SCSI) oder HVD (High-Voltage-Differential ) die dazu überhaupt nicht kompatibel sind, die aber wahrscheinlich eh nur in der "Profiliga" verwendet wurden, weil viel zu teuer. An den Steckverbindungen ist das physikalische Protokoll so besonders bei etwas älteren Geräten nicht immer eindeutig erkennbar, desshalb sind hier Aufdrucke und/oder SCSI-Logos an den Schnittstellen angebracht die das erkennbar machen.
Die Kabel unterscheiden sich auch, hier ist es oft für einen Laien noch schwieriger das wirklich Richtige zu finden. Wenn die Kabellängen ans Maximum gehen und die Geschwindigkeit auf dem Bus maximal ausgehandelt ist, merkt man dann an der Fehlerrate das das Kabel wohl die falsche Impedanz hat.

Meine Vermutung ist das DLT ist ein SE-Gerät, ebenso wie wahrscheinlich auch dein Kontroller, das LTO2 mit dem Wechsler sollte allerdings ein LVD sein (die alten Protokolle währen für dieses Gerät viel zu langsam und um diese Zeit wurden wohl keine Neugeräte mehr mit SE-SCSI hergestellt)

Am besten hier mal ein bischen stöbern http://de.wikipedia.org/wiki/Small_Computer_System_Interface#Die_verschiedenen_SCSI-Standards

robi
 
OP
C

chappert

Hacker
also nach längerer hin und her getesterei sieht es wohl so aus das der Server net mehr hängen bleibt wenn ich den einzelenen LTO Wechsler ab hänge. Wundern tuts mich nur weil es so schon eine gaaanze Weile funktioniert hat...

robi schrieb:
Wie ich das sehe hat der SCSI-Kontroller , welcher ? ein Problem am BUS mit den beiden Laufwerken. Ein LVD und ein SE Laufwerk an einem Bus :irre: für den hausgebrauch gerade noch vertretbar bei einem produktiven Servern in der "Profi-Liga" strikt abzuraten

robi

dazu muss ich noch sagen das an diesem Bus ein DELL PVT124T Backup Server dran hängt der sowohl eine Lader und ein Laufwerk drin hat, dieser wird über eine externe SCSI Schnittstelle von dem Controller aus angesteuert.
PV124T

Code:
Host: scsi2 Channel: 00 Id: 01 Lun: 00
  Vendor: CERTANCE Model: ULTRIUM 2        Rev: 1914
  Type:   Sequential-Access                ANSI  SCSI revision: 03
Host: scsi2 Channel: 00 Id: 01 Lun: 01
  Vendor: DELL     Model: PV-124T          Rev: 0043
  Type:   Medium Changer                   ANSI  SCSI revision: 02

diese Meldung ist allerdings aus der messages nicht weg zu bekommen
Code:
Nov 17 00:10:15 Roy kernel: scsi2: PCI error Interrupt at seqaddr = 0x56
Nov 17 00:10:15 Roy kernel: scsi2: Data Parity Error Detected during address or write data phase
 
A

Anonymous

Gast
chappert schrieb:
dazu muss ich noch sagen das an diesem Bus ein DELL PVT124T Backup Server dran hängt der sowohl eine Lader und ein Laufwerk drin hat, dieser wird über eine externe SCSI Schnittstelle von dem Controller aus angesteuert.
Das ist ja auch ok, aber oben hast du
Code:
Host: scsi2 Channel: 00 Id: 01 Lun: 00
  Vendor: CERTANCE Model: ULTRIUM 2        Rev: 1914
  Type:   Sequential-Access                ANSI  SCSI revision: 03
Host: scsi2 Channel: 00 Id: 01 Lun: 01
  Vendor: DELL     Model: PV-124T          Rev: 0043
  Type:   Medium Changer                   ANSI  SCSI revision: 02
Host: scsi2 Channel: 00 Id: 05 Lun: 00
  Vendor: BNCHMARK Model: DLT1             Rev: 5538
  Type:   Sequential-Access                ANSI  SCSI revision: 02

Und das bedeutet, da ist auch noch ein DLT1 irgendwo. Und ich vermute das hängt am internen Bus des selben Kontrollers und zwar in etwa so.
Code:
Terminator(Target5)<->DLT1<--->(intern)Kontroller(extern)<------->PV-124T(Target1;LUN0,1)<->Terminator
Und hier hast du mehrere Problemstellen.
  • 1. im Kontroller muss Termination ausgeschalten werden. (im BIOS des Kontrollers oder evtl. bei älteren Kontrollern auch über Jumper)
    2. Es müssen beide Seiten zwingend terminiert werden
    3. Beide Terminatoren müssen zwingend SE sein. (in diesem Fall nicht einen eventuell mit dem PV-124T gelieferten (SE-LVD-Kombi) Terminator verwenden)
    4. wird das externe PV-124T temporär entfernt, dann ist der SCSI-Bus offen, damit auch wieder Fehlermeldungen am Bus.
    5. sowohl intern wie auch extern ist das Kabel extrem kurz zu halten (extern <= 1m)


robi
 
OP
C

chappert

Hacker
also das Kabel zum PV124T ist ca. 2m :( warum muss das so kurz sein????

am controler hab ich eine externe Schnittstelle an der der PV124T hängt
dann hab ich noch 2 interne die jetzt aber frei sind da ich das LTO abgehängt habe
die autonegetation im Controller ist eingeschalten, soweit ich weis gibt es für interne schnittstellen gar keine Terminatoren
sondern nur für die kabel selber die allerdings wiederum net auf die eigtl. schnittstelle passen (männlich/weiblich Problem)

Warum soll ich die Termination im Controler jetzt wieder ausschalten??? solte ich nicht erst überprüfen ob diese eingeschalten sind???
Und wenn ich die auschalte hab ich doch aber keine Terminatoren wir die internen schnittstellen da es sowas nicht gibt, glaub ich :???:

also irgendwas hab ich glaub ich net ganz verstanden...
 
Oben