Páginas

segunda-feira, 27 de abril de 2009

Configurando o Nagios

Fala pessoal…desculpe pela demora nesse outro post…
Esse post é uma extensão da instalação do nagios.
Aqui vou descrever como configurar hosts, serviços, contatos, templates….
Como funciona?
A configuração é dividida em partes (e em arquivos) sendo elas:
  • nagios.cfg
  • commands.cfg
  • contacts.cfg
  • templates.cfg
  • timeperiods.cfg
Listei aqui os arquivos principais, que serão utilizados nas configurações.
nagios.cfg = é o arquivo base do nagios;

commands.cfg = contém todas as definições de comandos / parâmetros necessários para as checagens;

contacts.cfg = aqui é definido os contatos e os grupos de contatos para notificações

templates.cfg = nesse arquivo, é definido as opções genéricas para todos os objetos a serem monitorados. Por exemplo você pode criar um template para monitorar impressoras, nesse template você define que o tipo de notificação será somente nos casos de Down. Lembre-se, a opção register deve sempre estar setada como 0.

timeperiods.cfg = define os dias e horas que os serviços serão monitorados. Você pode definir que um serviço seja monitorado dàs 8:00 até às 18:00. Eventos fora desse período não serão alertados.
Sendo assim, é necessário saber o seguinte para efetuar a configuração:
Todo host, tem que ter um template para ele, por padrão usamos o template genérico de hosts, ele atende em 90% dos casos.
Todo serviço tem que ter um host associado a ele, que por sua vez também tem que ter um template genérico para ele.
Todo comando  deve ser especificado no arquivo commands.cfg (é como se fosse o template do comando), lá já existem alguns comandos prontos para uso.
Uma boa organização desses arquivos é super importante na hora de encontrar alguma opção para ajustes ou até mesmo a remoção de um host do monitoramento.
Eu costumo separar os arquivos de hardwares (switches, access points etc…),  hosts e serviços separados por sistema operacional.
Vamos comecar a criar os arquivos necessários:
Dentro de /etc/nagios/objects crie um diretório chamado monitoradas
mkdir /etc/nagios/objects/monitoradas
Dentro de monitoradas crie alguns arquivos chamados servidores-linux.cfg e servidores-windows.cfg e também servicos-linux.cfg e servicos-windows.cfg e o arquivo contendo os administradores contato-admin e time-admins
cd /etc/nagios/objects/monitoradas
touch servidores-linux.cfg servidores-windows.cfg servicos-linux.cfg servicos-windows.cfg contato-admin.cfg time-admins.cfg
Vamos começar com os servidores-linux.cfg, vamos começar a definir o primeiro host (fora o localhost) a ser monitorado.
define host{
use                    linux-server
host_name              server.domain.com
alias                  server
address                172.16.1.123
}
Explicando as linhas:

define host =diretiva que indica que estamos definindo um host na configuração

use = este campo representa o template, ele importa as variáveis que foram definidas no template (mais abaixo irei detalhar como funciona o template)

host_name = nome completo da maquina exemplo: server.domain.com ou o seu endereço IP.

alias = nome para exibição: server

address = endereço IP ou nome, eu recomendo o uso de endereços IP, se o serviço de DNS falhar por algum motivo o monitoramento de outros recursos não é prejudicado.
Uma outra coisa bastante interessante para se manter a ordem, é a criação de grupos de hosts. Isso é interessante na hora de visualizar máquinas por exemplo: servidores da filial 1.
Para criar os grupos veja o modelo abaixo:
define hostgroup{
hostgroup_name      filial1
alias               Filial 1 – SPO
members             server, server1, server2
}
Explicando as linhas:

define hostgroup = indica que estamos criando um novo grupo de hosts

alias = nome para a exibição

members = todas as máquinas participantes do grupo. Deve-se ficar atento: As máquinas que serão listadas aqui, devem ser separadas por “,” (virgula), o nome usado pode ser o do alias e o mais importante os hosts devem estar declarados.
Esse procedimento deve ser repetido para todos os HOSTS que você deseja monitorar e lembre-se criar arquivos distintos para equipamentos, isso ajuda muito na localização. Isso vale também para a criação dos grupos de hosts…


Configurando Serviços

O Nagios monitora tanto hosts como serviços. Por exemplo, você tem um servidor web e por algum motivo o serviço de http cai, mais a máquina fica online, um alerta é gerado, e uma ação por parte do sysadmin é tomada.
Os monitores de serviços são scripts criados em diversas linguagens, que retornam os valores para o nagios e esse por sua vez trata os valores como estados que são eles:
  • OK
  • WARNING
  • UNKNOWN
  • CRITICAL
OK = Serviço sadio, sem problemas.

Warning = O serviço entrou estado de alerta (este valor é personalizável)

Unknown = Estado desconhecido, ou o plugin ainda não foi executado ou ele está devolvendo um valor que o nagios não espera

Critical = Estado crítico, o serviço está com problemas / indisponível
Existem duas formas de se monitorar um host. A forma ativa e a passiva.
A forma ativa é a mais comum, e funciona da seguinte maneira:
O nagios executa o plugin correspondente (o plugin se conecta diretamente na porta ou executa o comando)  e ele retorna um dos 4 valores.
Já a forma passiva é usada para enviar alertas para o servidor de nagios. Nesse caso iremos configurar hosts do tipo Ativo, verificações passivas ficam para um próximo artigo :p
Edite o arquivo /etc/nagios/monitoradas/servicos-linux.cfg
define service{
use                         local-service
host_name                   server
service_description         SSH
check_command               check_ssh
notifications_enabled       1
}
Explicando as linhas:

use = Template do serviço.

host_name = Nome do host que hospeda o serviço.

service_description = Descrição do serviço

check_command = É o nome do plugin que irá checar o serviço. Os comandos de checagem são definidos no arquivo commands.cfg (visto mais adiante)

notifications_enabled = Notifica o administrador em caso de erros? 0 para não e 1 para sim
Essas linhas são as configurações mais básicas no help online do nagios você pode encontrar todas as possíveis opções.


Comandos de verificação

Como disse anteriormente, o nagios funciona com scripts que faz a verificação de hosts / serviços. Agora vamos entender como funciona a definição de comandos e onde os scripts são localizados.
Na instalação do nagios, todos os scripts ficam no diretório /usr/lib/nagios/plugins . O arquivo commands.cfg é responsável por parametrizar os comandos de chegagem, sendo assim quando na opção check_command é definido check_ping por exemplo, o nagios busca as informações (path, arguimentos requeridos etc…) sobre o plugin. Nesse arquivo você pode definir um script que você escreveu ou personalizar os parametros de um script já existente.
Veja o exemplo do comando check_ssh ( esse exemplo foi retirado do arquivo /etc/nagios/commands.cfg)
define command{
command_name    check_ssh
command_line    $USER1$/check_ssh $ARG1$ $HOSTADDRESS$
}
Note que todas as linhas são auto explicativas e bem parecidas com as anteriores, o que vale dizer é: $USER1$ é = ao path dos scripts, $ARG1$ = ao primeiro argumento passado ao script, esse número de argumentos é “infinito” e por ultimo $HOSTADDRESS$ = é o endereço da máquina, ele pega esse valor da definição do host.
  • Vale lembrar que antes de definir um serviço você deve dar uma olhada no commands.cfg e no diretório /usr/lib/nagios/plugins para ver quais scripts estão disponíveis para o uso.
Grupos de Serviços
Assim como hosts, serviços podem ser agrupados para uma melhor organização e visualização posterior na interface gráfica.
Para definir:
define servicegroup{
servicegroup_name       SSHservices
alias                   Servidores SSH
members                 server1, server2, server3
}
As regras são as mesmas para a definição de grupo de hosts….


Contatos

Os contatos no nagios são as pessoas que serão notificadas quando um evento ocorrer com um host / serviço monitorado. É através dessa opção que o pessoal te acorda de madrugada :p
Como funciona:  Quando uma checagem de serviço ou host falha, retorna, da algum erro desconhecido, o nagios imediatamente verifica qual é o tipo de erro e procura quem ele deve chamar (enviar um e-mail por exemplo).
Essas configurações são armazenadas no arquivos contacts.cfg. É importante você usar o conceito de grupos nesse caso (em todos os outros também) mas nesse caso é um pouco diferente, imagine se um sysadmin que trabalha com você se desliga da empresa, e você definiu somente os nomes para serem notificados, essa terefa seria um pouco complicada quando um novo adminstrador entra na empresa… Usando grupos você altera somente em um lugar…  
define contact{
contact_name             admin1
use                      generic-contact
alias                    Admin 1
email                    admin@no-spam.com
}
Novamente, tudo muito parecido com as definições anteriores…
Definição do grupo
define contactgroup{
contactgroup_name       admins
alias                   SysAdmins
members                 admin1
}
Também nada de novidade…. :p lembre -se, no grupo, os membros são definidos pelo campo contact_name


Templates

Templates, o que é? eu falei tanto sobre o tal dos templates, confesso, quando começei a mexer com o nagios sempre tive essa dúvida. Vou tentar explicar o que é…
Os templates contém todas as configurações padrão de todos os objetos monitoráveis do nagios. Por exemplo, você pode definir quais os tipos de notificação que um administrador irá receber
Veja o exemplo do caso dos administradores…
# Generic contact definition template – This is NOT a real contact, just a template!
define contact{
name                                                                      generic-contact         ; O nome desse template de contato
service_notification_period                       24×7                    ; Notificações de serviços serão enviados a qualquer hora
host_notification_period                             24×7                    ; Notificações de serviços serão enviados a qualquer hora
service_notification_options                     w,u,c,r,f,s           ; Envia qualquer tipo de notificação para serviços
host_notification_options                           d,u,r,f,s               ; Envia qualquer tipo de notificação para serviços
service_notification_commands              notify-service-by-email ;envia a notificação por e-mail de serviços
host_notification_commands                    notify-host-by-email    ; envia a notificação por email de hosts
register                                                                 0                       ; Esta é somente a definição de um template 0 para não ser considerada como um contato.
}
Vale comentar o seguinte:

service_notification_options = Opções:

w = Warning (aviso)
u = Unreacheable (inalcançavel)
c = Critical (critico)
r = Refused (recusado)
f = Flapping (Oscilando entre disponível / indisponível)
s = Scheduled (Agendada)

host_notification_options = Opções

d = Down (“caiu” / inoperante)
u = Unreacheable (inalcançavel)
r = Refused (Recusado)
f = Flapping (oscilando entre disponível / indisponível)
s = Scheduled (Agendado)
Considerações Finais

1 – Vale a pena dar uma olhada em todos os arquivos antes, o nagios já vem com a configuração do localhost pronta, com isso já da pra ter uma base do que e como fazer.
2 – A documentação online do nagios é excelente vale a pena verificar.
3 – Pessoal, acho que é isso, se não ficou alguma coisa clara, se você não entendeu, envie um e-mail

2 comentários:

  1. Kra já li mtos artigos sobre nagios mas este é o melhor.. parabéns

    ResponderExcluir
  2. Amigão, não esta especificando os comandos para acessar o script, exemplo:
    define contactgroup{
    contactgroup_name admins
    alias SysAdmins
    members admin1
    }

    ResponderExcluir