30.06.2010
23:32 von
TBT
Nagios Überwachung des Server-Load
Hallo,
ich gehe mal von einem funktionierendem Nagios3, sowie Nagiosgrapher aus.
Die Konfiguration in der services_nagios2.cfg wird wie folgt angelegt
W1-W3: die Warnstufen für die 3 Werte des Load (1min, 5min, 15min)
C1-C3: die Criticalstufen für die 3 Werte des Load (1min, 5min, 15min)
COMMUNITY: snmp Community für die Authentifizierung
in der hostgroup.cfg dann die Rechner mit dem Service verbinden
die Datei /etc/nagiosgrapher/ngraph.d/standard/check_load.ncfg habe ich meinen Wünschen angepasst, da die Ausgabe vorher für mich ungünstig war. In der Originalen Konfiguration werden die Werte übereinander gestapelt, mit dem 1min ganz oben. Dadurch kann man den 1min nicht mehr wirklich ordentlich ablesen. Auch habe ich den Durchschnittswert auf den 1min Wert berechnen lassen.
Die Hauptänderung sind die regulären Ausdrücke zum Ermitteln der Performancedaten, die haben nicht auf die vom snmpd gelieferten Antworten gepasst
ich gehe mal von einem funktionierendem Nagios3, sowie Nagiosgrapher aus.
Die Konfiguration in der services_nagios2.cfg wird wie folgt angelegt
Code
1
2
3
4
5
6
7
2
3
4
5
6
7
define service {
hostgroup_name cpu_load
service_description LOAD
check_command check_snmp_load_v1!netsl![W1],[W2],[W3]![C1],[C2],[C3]!![COMMUNITY}
use generic-service
notification_interval 0 ; set > 0 if you want to be renotified
}C1-C3: die Criticalstufen für die 3 Werte des Load (1min, 5min, 15min)
COMMUNITY: snmp Community für die Authentifizierung
in der hostgroup.cfg dann die Rechner mit dem Service verbinden
Code
1
2
3
4
5
2
3
4
5
define hostgroup {
hostgroup_name cpu_load
alias Load Überwachung
members [RECHNER1],[RECHNER2],...,[RECHNERN]
}die Datei /etc/nagiosgrapher/ngraph.d/standard/check_load.ncfg habe ich meinen Wünschen angepasst, da die Ausgabe vorher für mich ungünstig war. In der Originalen Konfiguration werden die Werte übereinander gestapelt, mit dem 1min ganz oben. Dadurch kann man den 1min nicht mehr wirklich ordentlich ablesen. Auch habe ich den Durchschnittswert auf den 1min Wert berechnen lassen.
Die Hauptänderung sind die regulären Ausdrücke zum Ermitteln der Performancedaten, die haben nicht auf die vom snmpd gelieferten Antworten gepasst
Code
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
define ngraph{
service_name LOAD
# graph_log_regex :\s+(\d+[\.,]\d+),
graph_log_regex Load\s:\s(\d+[\.,]\d+)\s
graph_value 1min
graph_units load
graph_legend 1min avg load:
graph_legend_max 15
rrd_plottype AREA
rrd_color FF0000
}
define ngraph{
service_name LOAD
type GPRINT
print_source 1min
print_description Latest:
print_function LAST
print_format %2.2lf
}für die ungekürzte Fassung bitte einloggen
Werbung
19.07.2010
15:19 von
wotan
Was hast du hier noch angepasst, die Datei check_snmp_load_v1 gibt es nicht!
19.07.2010
17:49 von
TBT
doch gibt es 
in der Datei /usr/share/nagios-snmp-plugins/pluginconfig/snmp_load.cfg
im Paket nagios-snmp-plugins
Ein "apt-get install nagios-snmp-plugins" sollte dir helfen

in der Datei /usr/share/nagios-snmp-plugins/pluginconfig/snmp_load.cfg
im Paket nagios-snmp-plugins
Ein "apt-get install nagios-snmp-plugins" sollte dir helfen
19.07.2010
19:23 von
wotan
Fehlermeldung:
Invalid check type (-T)!
19.07.2010
19:30 von
wotan
Bekomme keine Daten von abfragenden Server, noch irgend was vergessen?
19.07.2010
20:46 von
TBT
snmp läuft, und gibt dir auch normal Antwort bei "check_mem" oder so?
Was bekommst du, wenn du die Perl Datei mal direkt aufrufst mit
perl /usr/lib/nagios/plugins/check_snmp_load.pl...
Was bekommst du, wenn du die Perl Datei mal direkt aufrufst mit
perl /usr/lib/nagios/plugins/check_snmp_load.pl...
19.07.2010
20:50 von
wotan
/usr/lib/nagios/plugins/check_snmp_load.pl -H xxx.xxx.xxx.xxx -C xxxxxxxx -w 3 -c 4
1 CPU, load 1.0% < 3% : OK
Im Script ist es wie folgt:
check_snmp_load_v1!nets!3,4,5!4,5,6!!xxxxxxxx
19.07.2010
21:20 von
TBT
was sagt denn das Nagios Log?
Da steht die komplette Antwort vom Server drin, bei entsprechendem Log-Level
Da steht die komplette Antwort vom Server drin, bei entsprechendem Log-Level
19.07.2010
21:41 von
wotan
Hier der Log:
SERVICE ALERT: xxxxxxxxxx;CPU-Load;UNKNOWN;SOFT;1;Invalid check type (-T)!
19.07.2010
22:29 von
wotan
Hier ist ein Übertragungsfehler drin:
so ist es richtig:
check_snmp_load_v1!nets!3,4,5!4,5,6!!xxxxxxxx
so ist es richtig:
check_snmp_load_v1!netsl!3,4,5!4,5,6!!xxxxxxxx