ich gehe mal von einem funktionierendem Nagios3, sowie Nagiosgrapher aus.
Die Konfiguration in der services_nagios2.cfg wird wie folgt angelegt
2
3
4
5
6
7
define service {
hostgroup_name cpu_load
service_description LOAD
check_command check_snmp_load_v1!netsl![W1],[W2],[W3]![C1],[C2],[C3]!![COMMUNITY}
use generic-service
notification_interval 0 ; set > 0 if you want to be renotified
}
W1-W3: die Warnstufen für die 3 Werte des Load (1min, 5min, 15min)
C1-C3: die Criticalstufen für die 3 Werte des Load (1min, 5min, 15min)
COMMUNITY: snmp Community für die Authentifizierung
in der hostgroup.cfg dann die Rechner mit dem Service verbinden
2
3
4
5
define hostgroup {
hostgroup_name cpu_load
alias Load Überwachung
members [RECHNER1],[RECHNER2],...,[RECHNERN]
}
die Datei /etc/nagiosgrapher/ngraph.d/standard/check_load.ncfg habe ich meinen Wünschen angepasst, da die Ausgabe vorher für mich ungünstig war. In der Originalen Konfiguration werden die Werte übereinander gestapelt, mit dem 1min ganz oben. Dadurch kann man den 1min nicht mehr wirklich ordentlich ablesen. Auch habe ich den Durchschnittswert auf den 1min Wert berechnen lassen.
Die Hauptänderung sind die regulären Ausdrücke zum Ermitteln der Performancedaten, die haben nicht auf die vom snmpd gelieferten Antworten gepasst
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
define ngraph{
service_name LOAD
# graph_log_regex :\s+(\d+[\.,]\d+),
graph_log_regex Load\s:\s(\d+[\.,]\d+)\s
graph_value 1min
graph_units load
graph_legend 1min avg load:
graph_legend_max 15
rrd_plottype AREA
rrd_color FF0000
}
define ngraph{
service_name LOAD
type GPRINT
print_source 1min
print_description Latest:
print_function LAST
print_format %2.2lf
}
