O Relatório de Análise de Causa Raiz (ACR) do Site24x7

O Relatório de Análise de Causa Raiz (ACR) do Site24x7 oferece informações valiosas sobre os vários problemas em sua infraestrutura de TI. Nesta publicação, veremos como interpretar um relatório ACR e como colocar o ACR em um ótimo uso na identificação e resolução de problemas de desempenho e rede.



Análise de causa raiz (ACR); o que a torna diferente?


A ACR é diferente de um alerta de inatividade convencional. Os alertas convencionais de tempo de inatividade contêm detalhes como horário de início da instância e Traceroute, se disponível, o que é suficiente para você saber o que aconteceu. No entanto, a questão crítica de por que aconteceu permanece sem resposta. Você precisa saber o que causou o problema imediatamente para começar a trabalhar nisso.

A análise de causa raiz gera automaticamente uma infinidade de informações para chegar a uma conclusão definitiva sobre o que desencadeou um tempo de inatividade. A ACR pretende determinar a causa raiz de tempo de inatividade específico ou problemas de desempenho. Em suma, a ACR pretende responder perguntas como o que deu errado, como isso deu errado e por que deu errado.

 

Interprete o seu relatório ACR


Tomaremos um exemplo de um cenário simples de “site não acessível” e tentaremos interpretar o que o relatório diz. Um relatório ACR normal incluirá os seguintes detalhes:

  • Verificações da localização primária e re-verificações dos locais secundários. 
  • Análise de Ping
  • Análise de DNS
  • Análise Traceroute baseada em ICMP ou TCP
  • Relatório MTR
  • Conclusão

 

Detalhes do monitor e detalhes da localização:

 

Esta seção mostra o status atual do seu site quando é consultado nos locais de monitoramento primário e secundário. Isso terá detalhes de tempo de inatividade, duração e motivo de localização razoável para a interrupção.

Primeira verificação – A primeira verificação é feita a partir da Localização Principal


 1. Captura de tela: 

Essa captura de tela é o erro exato retornado quando as estações de monitoramento tentaram se conectar ao seu site. Este tipo de captura de tela funciona como uma prova ou evidência do que aconteceu exatamente quando o site estava tentando alcançar o servidor remoto. No nosso exemplo, o site retornou o erro ‘Conexão com Tempo Esgotado’.

 

2. Análise Ping e Análise Traceroute

Status: Servidor inacessível devido ao tempo limite em Hop 16


A Análise Ping pode ser usada para coletar informações valiosas, como o número de pacotes enviados, perda de pacotes e tempo de resposta. A Análise Traceroute te permite diagnosticar problemas de rede e ajuda a identificar qualquer vulnerabilidade na sua rede. A Traceroute é uma ferramenta simples para mostrar o caminho real para um servidor remoto. Isso pode ser qualquer coisa de um site que você tenta se conectar a um dispositivo remoto em sua rede de intranet. Todos os tracerouts, exceto o monitor Ping, utilizam o protocolo TCP. O monitor Ping gera um ICMP baseado em tracerout.

 

3. Teste: análise de domínio

Status: Domínio resolvido corretamente

Esta é uma verificação completa dos seus Servidores de Nomes e Servidores de E-mail. Ele recupera registros como detalhes da SOA e desempenho do servidor de nomes.

 

4. Relatório MTR

O MTR, também conhecido como My Traceroute, combina a funcionalidade do Traceroute e Ping em uma única interface. Ao combinar essas funcionalidades, o MTR constantemente pesquisa seu servidor remoto e permite que você veja como a latência e o desempenho mudam ao longo do tempo. Uma vez que a saída é constantemente atualizada no MTR, ele permite que você colete as tendências e as médias de desempenho real e lhe dê uma imagem clara do desempenho da rede em um período de tempo variado.

Re-checagem da localização secundária

O mesmo conjunto de testes também será realizado de todos os seus locais secundários configurados. Isto serve para confirmar o tempo de inatividade real.

 

5. Conclusão


Este é o lugar onde o relatório ACR informa o motivo provável para a ocorrência de interrupção com base nos resultados acima. A conclusão alcançada neste caso é “Conexão ao servidor caiu no Hop 16”. Isso, obviamente, tem algo a ver com a rede. Armado com esta conclusão, você pode baixar imediatamente corrigindo o problema.

Para site, API REST e o tipo de Monitor de Transação da API REST, o Site24x7 gera um problema ou relatório Down ACR. Ao contrário, os relatórios ACR não estão disponíveis para SSL, o Deslocamento do site e o Monitor de expiração de domínio. Gostaríamos de ouvir de você sobre como o ACR foi útil na identificação e solução de problemas. Compartilhe seus valiosos comentários nos comentários.

Tire todas suas dúvidas.
Entre em contato com o time da ACSoftware que teremos o prazer em lhe ajudar com o Site 24×7.

ACSoftware / Figo Software seu Distribuidor e Revenda ManageEngine no Brasil

Fone (11) 4063 1007 – Vendas (11) 4063 9639

 

 

Deixe uma resposta