• Willkommen im Linux Club - dem deutschsprachigen Supportforum für GNU/Linux. Registriere dich kostenlos, um alle Inhalte zu sehen und Fragen zu stellen.

[gelöst] Performance-Einbruch bei smartctl -t long (Raid)

Ich benutze ein Raid Array mit 5 Platten + 1 Reserve-Platte:
Code:
root@tox:mdadm -D /dev/md0
/dev/md0:
        Version : 0.90
  Creation Time : Sat Mar 22 22:06:38 2008
     Raid Level : raid5
     Array Size : 2930287616 (2794.54 GiB 3000.61 GB)
  Used Dev Size : 732571904 (698.64 GiB 750.15 GB)
   Raid Devices : 5
  Total Devices : 6
Preferred Minor : 0
    Persistence : Superblock is persistent

    Update Time : Wed Aug  4 14:56:54 2010
          State : active
 Active Devices : 5
Working Devices : 6
 Failed Devices : 0
  Spare Devices : 1

         Layout : left-symmetric
     Chunk Size : 64K

           UUID : 8b017b7d:ee0ffdae:792b20fc:095bc9ab
         Events : 0.23833

    Number   Major   Minor   RaidDevice State
       0       8       49        0      active sync   /dev/sdd1
       1       8       65        1      active sync   /dev/sde1
       2       8       81        2      active sync   /dev/sdf1
       3       8       97        3      active sync   /dev/sdg1
       4       8       17        4      active sync   /dev/sdb1

       5       8       33        -      spare   /dev/sdc1
Das läuft performant ohne Probleme. Wenn ich aber nun einen Offline Selftest mit smartctl anstoße
Code:
for i in $(hwinfo --disk |grep "Device File:"|awk ' { print $3 } ') ; do
  echo -n  "Start offline disk self-test with smartmon ${i}  - ";
  smartctl -t long $i |grep "Test will complete"
done
fällt die Performance ins Bodenlose. Der Load steigt auf Werte zwischen 10 und 20 obwohl das System fast nichts zu tun hat:
Code:
top - 15:19:55 up 1 day, 21:57, 12 users,  load average: 20.54, 13.99, 7.94
Tasks: 313 total,   3 running, 309 sleeping,   1 stopped,   0 zombie
Cpu(s):  1.0%us,  1.7%sy,  0.0%ni,  0.0%id, 97.0%wa,  0.0%hi,  0.3%si,  0.0%st
Es ist zu beachten, dass die System-Platte nicht im Raid-Verbund ist. Sie läuft ohne Einschränkungen. Der Weert "97,0%wa" bei einer CPU-Auslastung unter 3% zeigt mir, dass alles auf die Platten wartet.
Wenn ich nur die Reserve-Platte mit dem offline selftest beaufschlage, gibt es keine Performance-Einbußen - so wie ich es bisher in einem LVM-System gewohnt war.

Meine Fragen:
1) Verträgt sich smartctl -t ... nicht mit Raid?
2) Gibt es Erfahrungen und ggf. eine Umgehungslösung?
3) Wie kann ich erreichen, dass die Platten nacheinander in den Test gehen?
=========================================================
In den Man-Pages von smartctl habe ich folgenden Hinweis gefunden:
The second category of testing is called "offline" testing. This type of test can, in principle, degrade the device performance.
Bei 5 Platten 'eingeschränkte Performance' gleichzeitig ergibt sich in Summe eine 'miserable Performance' !?
Wenn nur eine Platte in den Selbsttest geht läßt sich mit der Performance leben!
 
Oben