Há alguns meses que penso em formas de aproveitar melhor os dados coletados pelo Zabbix. Em paralelo a isso vejo quase que diariamente fornecedores vindo ofertar onde trabalho soluções miraculosas para correlacionamento de eventos.
Após alguns “POCs” (Provas de Conceito) não consegui tirar da minha cabeça: Pô… boa parte disso é análise… não é ferramenta… e o Zabbix tem este dado… só não tem uma forma bacana de apresentar… ou melhor… não tinha.
Há algumas semanas os usuários do fórum Zabbix-Brasil me viram fazendo um “call for betas”. Como o recurso é novo eu sabia que tinha que testa-lo na maior quantidade de ambientes o possível visando possibilitar validar se mais esta idéia maluca era realmente funcional ou não.
Investi também algum tempo colocando os arquivos do Zabbix-extras em um repositório público possibilitando assim que mais pessoas auxiliem com o mesmo.
Consegui o auxílio de cerca de dez membros da comunidade que executaram toda uma bateria de testes contra esta nova versão do Zabbix-Extras. Além da nova funcionalidade eu construí também um instalador baseado em menus para o bash visando simplificar o processo de instalação.
Para que o instalador funcione dois pacotes padrões do linux deverão estar instalados:
- wget – para efetuar download do pacote instalador;
- dialog – para construir os menus de instalação;
O início do processo de instalação é o mesmo dos anteriores. Efetue o download do arquivo abaixo e execute o script.
sh instalaExtras2.sh
Será feita uma validação visando identificar se os pacotes wget e dialog estão instalados, se eles não estiverem instalados o instalador os adicionará. Assim que finalizar a parte de validação de pacotes será apresentada uma tela para que você selecione o idioma.
Após a seleção do idioma o instalador irá precisar que você informe o caminho para os arquivos do frontend (interface gráfica) do seu Zabbix.
Agora confirme que é para fazer o download dos aquivos do patch.
Selecione quais módulos devem ser habilitados (eu recomendo todos).
Agora revise os parâmetros que você informou e confirme para que o instalador proceda com a instalação dos arquivos e a inserção dos menus no Zabbix.
Ao final sua tela deverá estar como a tela abaixo.
Agora voltemos à interface gráfica para que eu possa explicar quais são os conceitos envolvidos na nova funcionalidade e para que você possa iniciar o uso dela.
A pergunta que pretendo auxiliar a conseguirmos a resposta é:
- O quê causa o quê ?
- O incidente recorrente “A” é ocasionado por outra falha na minha infraestrutura ?
- Quando o incidente “B” ocorre, ele causa algum outro incidente ?
Qual é a minha proposta para responder a estas perguntas ? Todas elas tem uma coisa em comum: os incidentes, que no Zabbix são chamados de Eventos. Então me parece fazer algum sentido que a análise comece pela seleção de um incidente e a partir deste ponto o Zabbix-Extras faça uma análise de causa e efeito com eventos que ocorreram dentro de uma faixa X de tempo e que eu faça uma análise retroativa de algumas outras ocorrências similares.
Vamos analisar o exemplo abaixo. Selecionei em um laboratório um evento para correlacionamento: Internet fora – 26/04/2013 18:13.
Ao clicar no botão Correlacionar o Zabbix-Extras abre em outra janela o relatório correlacionando os eventos encontrados. Por padrão ele filtra os resultados para somente aqueles que tenham relacionamento em pelo menos 60% das ocorrências.
Neste teste ele localizou então cinco outros eventos que ocorrem quando Internet também ocorre, entretanto apenas três deles ocorreram em mais de 60% das vezes. Este filtro serve para direcionar as análise da sua equipe de gerenciamento de eventos.
Podemos observar que sempre que o evento Internet Fora ocorre o evento “ZDM X” também ocorre (estou nomeando os eventos de forma a possibilitar a apresentação aqui por questões de segurança), neste caso é altamente provável que ZDM X esteja relacionada com Internet Fora e valeria uma análise mais aprofundada por parte dos administradores destes serviços de forma a mitigarem tal situação.
Existem situações que não há o que se fazer, por exemplo, quando um servidor de banco de dados está fora o sitio que necessita consultar estas informações ficará fora também.
Mas existem outras situações onde é possível se perceber padrões tal qual um aumento significativo de tráfego no firewall causar a indisponibilidade de determinada parte de sua rede. Com a análise de causa e efeito correlacionando os eventos você passará a poder criar alertas que avisem que o evento irá ocorrer (aumento excessivo de banda… x minutos depois rede fora) permitindo que sua equipe atue proativamente evitando ou reduzindo o impacto do incidente.
Observem que passando o mouse por cima das “setinhas” que aparecem indicando que pode ser causa ou efeito você conseguirá ter um detalhamento melhor do que ocorreu.
Legal. Ja pensou em enviar estes recursos ao pessoal do desenvolvimento do zabbix?
Estou preparando o enhanced request para solicitar a adição. Mas sempre que publico eu coloco no forum original também para que todos possam ter acesso e tudo está no github 😉
Parabéns pela iniciativa, espero mesmo que a equipe do Zabbix inclua isso na próxima arvore de desenvolvimento como algo padrão dele, pois parece ser bastente útil.
Sucessos.
Como faço para participar dos testes do zabbix extras?
Me manda um e-mail que agente agiliza isso. Em 2 semanas deveremos começar um novo round de beta tester.
Para qual email posso enviar o meu interesse em participar dos testes…
Adail,
Show de bola, Parabéns!
Obrigado !
Olá,
Estou aprendendo zabbix agora, já aprendi instalar e configurar alguns Hosts. Ando seguindo muito seus Tutoriais e esse EXTRA era algo que eu desejava muito para aprimorar os Estudos.
Muito Obrigado pelos Tutoriais, cada dia aprendendo mais 🙂
Não por isso Thiago, o auxílio que presto hoje é parte do que recebi ontem e do que você provavelmente proverá a alguem na comunidade amanhã !
Adail,
Muito bons esses recursos… Tem me ajudado muito… Segue uma sugestão: Nos itens não suportados, acho que uma boa opção de filtro seria se pudéssemos escolher por excluir/incluir os hosts não monitorados… O que acha?
Parabéns, mais uma vez!!!!
Adail, achei bem legal a proposta..
Parabéns pelo trabalho.
Estou tendo este problema: (Sou cru em PHP):
Fatal error: Call to undefined function DBcondition() in /srv/www/htdocs/zabbix/zabbix-ns.php on line 152
Abraços,
Qual a versão do seu Zabbix ? Tem que ser uma 2.0 ou superior.
Qual o banco de dados que estais utilizando ?
Adail,
Boa noite. Comecei meus testes com Zabbix hoje, e seu site esta sendo fundamental para meu aprendizado. Obrigado por compartilhar.
Estou com uma dúvida e gostaria de sua ajuda. Você tem algum material publicado relacionado a monitoramento de link de internet com Zabbix? É que tenho 4 Firewalls, além de monitora-los quero monitorar os links de internet que chegam em determinadas portas deles.
Abraço!
Tiago,
Como são apresentados este link para o seu firewall ? Como uma interface específica ? Se for assim um LLD pode adicionar os itens para monitorar o volume de dados em cada uma delas separadamente.
Entre no fórum da comunidade Brasileira que lá conseguimos te auxiliar com isso provavelmente. http://br.groups.yahoo.com/group/zabbix-brasil/
Olá, instalei através do script e funcionou perfeitamente, mas os menus ficaram em inglês, mesmo tendo escolhido a opção PT-BR.
Existe alguma variável em algum php on eu seto a linguagem? E muito obrigado pelo esforço.
Eduardo, deve ter acontecido algum problema durante a instalação. Tente instalar novamente pois eles deveriam ficar em portugues mesmo !
Adail,
Bom dia,
O script instalaExtras2.sh funciona no zabbix appliance ?
Att,
Não testei ele no opensuse… ele não deve funcionar pois este SO utiliza o Zypper e não o apt-get ou yum.
Vou tentar ajustar a proxima versão para funcionar também com o suse.
Por enquanto o que posso dizer é que, por mais que seja bom para testes, o appliance disponível para download não deve ser usado para produção e, por isso mesmo, é bom você tentar fazer a sua própria instalação.
O script não funciona para a versão 2.2, não, né, Adail? Ou funciona, e é só tirar o tal do PERM_READ_LIST e substituir por PERM_READ_WRITE?
Eduardo,
Quando ela foi feita ainda não existia a 2.2 (nem em alfa) use esta aqui: http://spinola.net.br/blog/?p=496
Esse módulo já foi testado no Zabbix 2.2?
fiz a atualização e está dando erro de algumas variáveis que não sáo mais utilizados: PERM_READ_LIST.
Use of undefined constant PERM_READ_LIST – assumed ‘PERM_READ_LIST’ [index.php:109 → CView->render() → include() → require_once() → require_once() in /var/www/zabbix/include/menu.inc.php:283]
Use a nova versão que possui ainda mais funções interessantes (http://spinola.net.br/blog/?p=496).
Nobre, ao instalar aparece distribuição não prevista, porém o CentOS utiliza YUM também, como eu adequaria a instalação a essa distro ?
Obrigado desde já.
Já consegui, obrigado!
Funciona na versão 2.2?
A versão 2 do Zabbix-extras funciona (http://spinola.net.br/blog/?p=496).
O que o correlacionamento de eventos pode fazer que a dependência de triggers no zabbix não resolve?
Everton,
A dependência de triggers depende que você saiba que ela existe… o correlacionamento de eventos tenta lhe possibilitar que você descubra dependências que você não havia percebido antes. Por exemplo… o servidor de DNS primário derrubar um serviço que foi mal configurado e está usando apenas o seu servidor primário ao invés de usar o primário e secundário.
Desejo testar o zabbix Extras para zabbix 3.0, como faço?
Manda e-mail para [email protected]