Nagios: Servidores Dell y Debian stable/lenny
| 2010/05/26 | Posted by tripledes under Debian, Linux | Comments off |
Tenemos los servicios monitorizados ya? Sí? Vamos entonces a monitorizar el hardware, esa parte tan importante y a veces tan díficil de controlar ya que muchas veces tenemos las máquinas en un data center remoto o simplemente no disponemos del tiempo necesario para realizar los checkeos básicos.
Si ya usamos nagios, podemos tener el hardware monitorizado como servicios asociados a los servidores.
¿Qué necesitamos?
Principalmente servidores Dell
con Debian stable/lenny y Dell OpenManage Server Administrator (o OMSA). Dell distribuye esta herramienta en RPMs, aunque existe un repositorio de dichos paquetes preparados para Debian: https://subtrac.sara.nl/oss/omsa_2_deb
Una vez hemos seguido las instrucciones de configuración del repositorio e instalación de la herramienta, veremos que se nos instalan varios servicios/demonios, estos son para controlar los eventos de hardware y reportarlos como se deba o tomar las acciones requeridas.
Entre otros elementos, se nos instala una web de gestión remota del servidor como ya habreis visto en otros vendedores de servidores, el problema con esta web es que necesita los módulos de PAM de 32bits y si instalamos en 64bits, tenemos un problema…nada que no podamos solucionar con el paquete lenny de 32bits….una busqueda en google os dará las instrucciones que necesitais…esto es otra batalla ![]()
SNMP
Pues bien, vamos a habilitar el subagente SNMP para poder hacer queries relaccionadas con el hardware via Net-SNMP:
root@localhost:~# /etc/init.d/dataeng enablesnmp && /etc/init.d/dataeng restart && /etc/init.d/snmpd restart
Después de esto, tendremos que reiniciar el servicio de SNMP del sistema ya que su configuración ha sido modificada para incluir la entrada SMUX necesaria para la comunicación de los dos procesos.
Si todo ha ido bien, desde nuestro host de monitorización tendriamos que ser capaces de realizar SNMP gets con los OIDs necesarios para ver las metricas de nuestro hardware:
root@localhost:~# snmpget -c public -v 2c remotehost.local 1.3.6.1.4.1.674.10892.1.300.10.1.9.1
SNMPv2-SMI::enterprises.674.10892.1.300.10.1.9.1 = STRING: "PowerEdge 840"
Nagios
Si la respuesta es satisfactoria, procederemos a instalar el plugin necesario. Encontraremos varias opciones:
Seguro que buscando por Google, podreis encontrar otras opciones posiblemente más completas, pero yo personalmente y por el momento me quedo con check_openmanage, es muy completa y me parece una buena herramienta con features tipo blacklisting que nos permite no reportar elementos que no vamos a solucionar, como p.e. una revisión del driver de la controladora RAID desactualizado.
Una vez nos hemos decido, si nos decidimos por check_openmanage, deberemos seguir las instrucciones para instalarlo, la instalación es bastante directa, al menos en OpenSuSE 11.0.
Con todo instalado, configuramos el archivo de comandos de Nagios:
define command{
command_name check_omsa
command_line $USER2$/check_openmanage -p -H $HOSTADDRESS$ -C $USER3$ -i -s $ARG1$
}
define command{
command_name check_omsa_noparm
command_line $USER2$/check_openmanage -p -H $HOSTADDRESS$ -C $USER3$ -i -s
}
He definido dos comandos ya que al primero le pueda pasar parámetros extra, como el blacklisting que comentaba anteriormente y sin parámetros para el checkeo básico.
$USER3$ es la variable que tengo definida en el fichero de resources de Nagios con valor igual a la comunidad de SNMP que tengo configurada en los servidores, de esta manera si la cambio algún día, no tengo que ir check por check cambiándola.
¿Y el resultado?
Bien, si no me he olvidado nada…ya tenemos nuestro servidor Dell (a nivel de hierro) monitorizado! Dudas, ideas….? a los comentarios ![]()
More From tripledes
- IDS: Replicación de datos con alta disponibilidad.
- Tecnología: Pensando en renovar el servidor de casa
- Debian: Instalación de IDS 11.50
tripledes Recommends
- bajar de peso (stanfieldsk)
- OMEGA 3. Auxiliar en problemas cardiacos, colesterol y triglicridos..flv (stanfieldsk)




