Analisar a causa raiz de um tempo de inatividade com o relatório RCA do Site24x7

O Relatório de Análise de Causa Raiz (RCA) do Site24x7 oferece informações valiosas sobre os vários problemas em sua infraestrutura de TI. Neste post, veremos como interpretar um relatório de ACR e como colocar a ACR em uso ideal na identificação e tratamento de problemas de desempenho e de rede. Análise de Causa Raiz; o que faz diferente?

A RCA é diferente de um alerta de tempo de inatividade convencional. Alertas de tempo de inatividade convencionais contêm detalhes como hora de início da instância e Traceroute, se disponível, o que é suficiente para você saber o que aconteceu. No entanto, a questão crítica sobre por que isso aconteceu permanece sem resposta. Você precisa saber o que causou o problema imediatamente começar a trabalhar nele.

A análise de causa raiz gera automaticamente uma infinidade de informações para chegar a uma conclusão definitiva sobre o que desencadeou um tempo de inatividade. A RCA pretende determinar a causa raiz de problemas específicos de tempo de inatividade ou desempenho. Em suma, a RCA pretende responder a perguntas como o que deu errado, como deu errado e por que deu errado. 

Interprete seu relatório de RCA.

Tomemos um exemplo de um cenário simples de “site não acessível” e tentamos interpretar o que o relatório diz. Um relatório RCA normal será composto dos seguintes detalhes:

  • Verifica a partir da localização principal e verifica novamente as localizações secundárias.
  • Análise Ping
  • Análise DNS
  • Análise de Traceroute baseada em ICMP ou TCP
  • Relatório MTR
  • Conclusão

Detalhes do monitor e detalhes do local: 

Esta seção mostra o status atual do seu site quando pesquisado nos locais de monitoramento Primário e Secundário. Isso terá detalhes de tempo de inatividade, duração e localização do motivo da interrupção.

Primeira verificação – a primeira verificação é feita a partir do local principal

1. Captura de tela: 

Esta captura de tela é o erro exato retornado quando as estações de monitoramento tentaram se conectar ao seu site. Esse tipo de captura de tela funciona como uma prova ou evidência do que exatamente aconteceu quando o site estava tentando acessar o servidor remoto. Em nosso exemplo, o site retornou o erro “Tempo de conexão esgotado“.

2. Análise de Ping e Análise de Traceroute

Status: Servidor inacessível devido ao tempo limite no Hop 16

A análise de ping pode ser usada para reunir informações valiosas, como o número de pacotes enviados, a perda de pacotes e o tempo de resposta. A análise de traceroute permite diagnosticar problemas de rede e ajuda a identificar qualquer vulnerabilidade em sua rede. Traceroute é uma ferramenta simples para mostrar o caminho real para um servidor remoto. Isso pode ser qualquer coisa de um site que você tente conectar a um dispositivo remoto em sua rede de intranet. Todos os traceroutes, exceto o monitor Ping, utilizam o protocolo TCP. Ping Monitor gera traceroute baseado em ICMP.

3 . Teste: análise de domínio 

Status : domínio resolvido corretamente

Esta é uma verificação de integridade completa dos seus Servidores de Nomes e Servidores de E-mail. Recupera registros como detalhes de SOA e desempenho do Servidor de Nomes.

4. Relatório MTR

O MTR, também conhecido como My Traceroute, combina a funcionalidade do Traceroute e Ping em uma única interface. Combinando essas funcionalidades, o MTR pesquisa constantemente o seu servidor remoto e permite que você veja como a latência e o desempenho mudam com o tempo. Como a saída é constantemente atualizada no MTR, ela permite que você colete tendências e médias de desempenho reais e fornece uma imagem clara do desempenho da rede durante um período de tempo variado.

Verificações novamente da localização secundária

O mesmo conjunto de testes também será realizado em todos os locais secundários configurados. Isso é para confirmar o tempo de inatividade real. 

5. Conclusão

É aí que o relatório RCA informa o motivo provável da ocorrência de interrupção com base nos resultados acima. A conclusão alcançada neste caso é “Conexão com o servidor foi descartada no Hop 16”. Isto é obviamente algo a ver com a rede. Armado com esta conclusão, você pode imediatamente começar a corrigir o problema.

Para o site, a API REST e o tipo Monitor de Transações da API REST, o Site24x7 gera um problema ou um relatório RCA inativo. Pelo contrário, os relatórios RCA não estão disponíveis para SSL, Website Defacement e Domain Expiry Monitor. Gostaríamos muito de saber como a RCA ajudou a identificar e solucionar problemas. Compartilhe seu feedback valioso nos comentários.

Comece a usar as notas no  Zoho CRM hoje e mantenha-se informado sobre as suas tarefas o tempo todo!

CSoftware / Figo Software seu Distribuidor e Revenda ManageEngine no Brasil

Fone (11) 4063 1007 – Vendas (11) 4063 9639

Deixe uma resposta