Diese Website existiert nur weil wir Werbung mit AdSense ausliefern.
Bitte den AdBlocker daher auf dieser Website ausschalten! Danke.

uptime / Nagios: check_load

Alles rund um die verschiedenen Konsolen und shells sowie die Programmierung unter Linux

Moderator: Moderatoren

Antworten
MOC
Newbie
Newbie
Beiträge: 35
Registriert: 11. Mai 2005, 00:29

uptime / Nagios: check_load

Beitrag von MOC »

Hallo zusammen,

habe folgendes Problem, ich nutze Nagios um sämtliche Server im Netzwerk zu überwachen. Nun habe ich die option check_load wo ich die Werte für die die CPU Last eingeben kann.
Laut Doku nutzt dieser check die daten wie wenn man "uptime" nutzt.

Ich verstehe nur den Zusammenhang der angaben dort nicht, man usw hatte ich schon durch, aber wenn ich z.B. sage ich will umgerechnet bei 50% CPU last ein warnung und bei 80% ein critical, wie mus ich diese range setzen?

uptime:
Durchschnittslast: 0,17, 0,16, 0,28
Also im Prinzip diese 3 Werte verstehen wie sie zusammengerechnet werden damit ich es schaffe eine limit dafür zu geben.

Danke euch und Gruß
MOC
Benutzeravatar
regexer
Advanced Hacker
Advanced Hacker
Beiträge: 1005
Registriert: 3. Dez 2004, 09:29
Wohnort: $_

Beitrag von regexer »

Ich verstehe nur den Zusammenhang der angaben dort nicht, man usw hatte ich schon durch, aber wenn ich z.B. sage ich will umgerechnet bei 50% CPU last ein warnung und bei 80% ein critical, wie mus ich diese range setzen?
Ich kenne dieses Nagios nicht. Ich gebe jedoch zu bedenken: Es ist aus meiner Sicht völlig uninteressant, ob die CPU mal zu 50% oder auch 80% ausgelastet ist. Selbst du 100% ist noch kein Beinbruch, solange das nur ein kurzer Peak ist. Viel interessanter ist doch, wie viele Prozesse aufgrund einer allgemein hohen Auslastung warten mussten. Und das ist exakt das, was diese drei von dir genannten Zahlen (=load average) aussagen. Wir hatten darüber schon mal eine Diskussion...

siehe http://www.linux-club.de/viewtopic.php?t=25495
Benutzeravatar
TeXpert
Guru
Guru
Beiträge: 2166
Registriert: 17. Jan 2005, 11:22

Beitrag von TeXpert »

was verstehst Du unter 80% Last?

der Load alleine ist relativ nichtssagend, er sagt aus wieviele aktive Prozesse gleichzeitig existieren. und das Zusammenspiel hängt stark von den verschiedenen Komponenten und der I/O-Architektur ab.

so ist das Arbeiten auf einer Single-CPU Maschine mit einfachem IDE-Bus ab 2.5 bis 3 nicht mehr schön, aber ersetze die IO durch ein gutes SCSI-Raid 5 und idr kannst Du noch mit einem Load von 5-8 gut arbeiten. Dicke Maschinen verkraften noch mehr, so ab ich letztens auf einer dicken Sun E-irgendwas rumgebastelt, ein Load von >80 merkt man nicht sonderlich...

Code: Alles auswählen

# to resolve all your problems, try this:
HOWTO='pack c5,41*2,sqrt 7056,unpack(c,H)-2,oct 115' && perl -le "print $HOWTO"
Ich beantworte keine Supportfragen per PM!
MOC
Newbie
Newbie
Beiträge: 35
Registriert: 11. Mai 2005, 00:29

Beitrag von MOC »

Perfekt danke euch, jetzt sagt mir das was :-)
Dann ist es für mich sinnvoller den "uptime" wert zu nehmen da ich das von einem durchschnittbrauche, wenn ich ein backup ziehe haber ich sofort 100% auslastung und die roten lampen fangen an.....

Grüße
MOC
Benutzeravatar
TeXpert
Guru
Guru
Beiträge: 2166
Registriert: 17. Jan 2005, 11:22

Beitrag von TeXpert »

MOC hat geschrieben:Perfekt danke euch, jetzt sagt mir das was :-)
Dann ist es für mich sinnvoller den "uptime" wert zu nehmen da ich das von einem durchschnittbrauche, wenn ich ein backup ziehe haber ich sofort 100% auslastung und die roten lampen fangen an.....

Ah, ja. Ich versteh z.Zt. noch weniger als bei Deinem 1. Post ;)

Code: Alles auswählen

# to resolve all your problems, try this:
HOWTO='pack c5,41*2,sqrt 7056,unpack(c,H)-2,oct 115' && perl -le "print $HOWTO"
Ich beantworte keine Supportfragen per PM!
MOC
Newbie
Newbie
Beiträge: 35
Registriert: 11. Mai 2005, 00:29

Beitrag von MOC »

Sorry, ich meinte das es für mich nützlicher ist dann die durchschnittszeit zu nehmen als die reine cpu last, da wenn ich z.b. ein backup auf einem server ziehe sofort 100%auslastung herrscht und nagios dann eben gleich auf critical springt.

Gruß
MOC
Benutzeravatar
TeXpert
Guru
Guru
Beiträge: 2166
Registriert: 17. Jan 2005, 11:22

Beitrag von TeXpert »

der Load (bei top und Co) sagt nichts über die CPU last aus... es können trivialprozesse sein (ein cp strengt die CPU nicht an) allerdings kopiere mal parallel 100 Dateien und Deine Load steigt, da alles auf das IO-System wartet.

Du musst Absolute Werte festlegen, bei denen Dein System nicht mehr reaktiv ist, und erst oberhalb davon warnst Du. Diese Werte sind auch kaum auf andere Maschinen zu übertragen

Code: Alles auswählen

# to resolve all your problems, try this:
HOWTO='pack c5,41*2,sqrt 7056,unpack(c,H)-2,oct 115' && perl -le "print $HOWTO"
Ich beantworte keine Supportfragen per PM!
MOC
Newbie
Newbie
Beiträge: 35
Registriert: 11. Mai 2005, 00:29

Beitrag von MOC »

Ja dann wirds schwer diese werte zu ermitteln damit ich die richtigen grenzwerte habe würde ich sagen, oder gibts da richlinien bei normalen pc's? servern ? usw?
Benutzeravatar
TeXpert
Guru
Guru
Beiträge: 2166
Registriert: 17. Jan 2005, 11:22

Beitrag von TeXpert »

nein, d.h. Du musst die Werte beobachten und für Deine Maschine Grenzwerte festlegen. OK, eine single-CPU Maschine nur mit IDE sollte IMHO nicht langfristig mit einem Load > 2-4 gefahren werden... das schaukelt sich sonst schnell hoch aber sonst... auf meinem Dual P3 mit SCSI-Raid5 IO bin ich auch mit einer Load von 10 noch glücklich...

Code: Alles auswählen

# to resolve all your problems, try this:
HOWTO='pack c5,41*2,sqrt 7056,unpack(c,H)-2,oct 115' && perl -le "print $HOWTO"
Ich beantworte keine Supportfragen per PM!
Antworten