Reiteradas vezes tenho recebido pedidos (forum, face, aqui no blog) sobre padrões de monitoração (templates).
Neste post vou explicar e disponibilizar dois templates que uso como base na construção dos ambientes de monitoração. Eles não tem a função de ser o “máximo” a se monitorar nem tampouco o mínimo e sim são uma sugestão do que eu entendo ser o MMC entre tantos locais e entendimentos sobre como monitorar um servidor.
Qualquer monitoração acaba por utilizar testes de ICMP (ping) como indicador extremo de indisponibilidade e, por isso mesmo, tenho um template específico para monitoração ICMP que faz o teste de disponibilidade e pega dados mínimos de performance. Sei que existem mais testes que se pode fazer, entretanto, este é o mínimo que eu considero.
O segundo template é o que faz a monitoração de sistema operacional Linux. Para a monitoração de um servidor (e a imensa maioria dos equipamentos de uma rede) eu entendo que alguns parâmetros são ‘obrigatórios’ de ser coletados por terem influência na disponibilidade e/ou performance dos dispositivos e da monitoração:
- CPU;
- Memória;
- Discos;
- Interfaces de Rede;
- Versão de SO;
- Versão do agente de monitoração;
Conforme eu sempre falo em minhas palestras eu criei uma padronização de codificação para facilitar a referência aos perfis de monitoração, ela não tem por objetivo ser perfeita nem ser a mais indicada para a sua realidade mas é uma forma de organizar os templates (que facilmente ultrapassam a casa das dezenas).
Eu agrupo os templates conforme abaixo:
000 – Sem agente | Este grupo tem por objetivo centralizar os templates que fazem monitoração passiva somente, ou seja, não precisam de quaisquer agente (snmp, zabbix) no objeto monitorado para que funcione. |
100 – Linux | Este grupo tem por objetivo centralizar os templates de monitoração de produtos ou serviços que utilizem o sistema operacional linux. Por exemplo uma monitoração de postgress ou mysql para linux estaria aqui. |
200 – Windows | Este grupo tem por objetivo centralizar os templates de monitoração de produtos ou serviços que utilizem o sistema operacional windows. Por exemplo uma monitoração de IIS ou SQLServer estaria aqui. |
300 – SNMP | Este grupo tem por objetivo centralizar os templates de monitoração de produtos ou serviços que coletem informações através do protocolo SNMP. Por exemplo uma monitoração de um switch ou roteador estaria aqui. |
O primeiro template (para ICMP) ficará mais bem acomodado se estiver no grupo 000 – Sem Agente uma vez que ele não exige agente remoto para executar os testes. O segundo por sua vez estará mais corretamente guardado se estiver no grupo 100 – Linux.
Ficamos então com dois templates:
- 000_PING
- 100_Linux
Os dois templates estão disponíveis para download a partir do repositório de templates que criei no github. Clique aqui para baixar todo o repositório de templates e importe os que desejar (no caso deste post seriam o template 000_ICMP e o template 100_Linux).
O repositório de templates irá possui pastas para melhor organização que seguem o mesmo padrão dos grupos de templates. Observem apenas que haverão templates de um grupo A que necessitarão de templates localizados em outros grupos, o processo de importação do zabbix irá alertar quando for necessário.