fbpx

Análise de causa raiz: por que ela é importante

Daniella Costa

Análise de causa raiz: por que ela é importante

Manter um alto nível de disponibilidade para cada aplicativo, permanecer no caminho de atualização e proteger a todos contra ataques mal-intencionados garante que a informação flua onde for necessário, quando necessário.

A análise de causa raiz (RCA) é o processo de descobrir a causa raiz de problemas para identificar as soluções adequadas. A RCA parte do princípio de que é muito mais útil prevenir sistematicamente e resolver os problemas subjacentes do que simplesmente tratar sintomas pontuais e apagar incêndios.

Relatório de análise de causa raiz (RCA)

Com o Site24x7, sempre que um tempo de inatividade é detectado, um  relatório de análise de causa raiz (RCA) é acionado e enviado a um usuário com base no contato e meio de alerta. O RCA gerado fornece o motivo real por trás do tempo de inatividade, junto com o mapa de rota de rastreamento para diagnosticar problemas de conectividade.

Por exemplo, um servidor falha devido a um alto uso do processo. O Site24x7 irá declarar o monitor como inativo e enviar um RCA ao usuário. O agente de monitoramento do servidor coletará os principais processos por CPU, memória e outros eventos antes do servidor travar e os apresentará no relatório RCA. Isso ajudará a solucionar problemas mais rapidamente e evitar problemas de degradação de desempenho semelhantes no futuro.

Os diferentes componentes de um relatório RCA para um servidor Windows e Linux são discutidos:

  • janelas
  • Linux

RCA para um servidor Windows:

Os vários componentes gerados em um relatório RCA quando um tempo de inatividade é detectado em um servidor Windows são os seguintes:

Detalhes do monitordetalhes básicos do monitor, incluindo nome do monitor, tipo, endereço IP, nome do host, duração do tempo de inatividade são listados.

Principais processos por CPU  (inclui a média dos últimos 5 minutos): Representação gráfica dos principais processos que utilizam a maior quantidade de CPU. Além disso, outro gráfico mostra os principais processos que utilizam a maior quantidade de memória nos últimos 5 minutos.

Principais processos por memória (inclui a média dos últimos 5 minutos): Representação gráfica dos principais processos que utilizam a maior quantidade de memória. Além disso, outro gráfico mostra os principais processos que utilizam a maior quantidade de memória nos últimos 5 minutos.

Detalhes do disco: lista os discos com seu tamanho total e o espaço livre disponível.

Status do disco rígido: o tamanho dos discos rígidos, seu status atual e qualquer descrição de qualquer erro ocorrido no disco rígido é fornecido.

Rota de rastreamento: para permitir a inclusão da análise de rota de rastreamento no RCA, o usuário deve fornecer acesso de firewall para obter a rota de rastreamento do domínio plus.site24x7.com. Habilitar isso permitirá que o usuário analise a razão real por trás dos problemas de conectividade e execute ações corretivas o mais rápido.

Logs de eventos: o tipo de logs de eventos (aviso, erro, falha de auditoria, crítico), sua descrição, a hora em que foi escrito e sua origem são anotados.

Saiba como o Site24x7 pode ajudar você e o seu negócio. Nossos técnicos estão disponíveis para te apresentar a melhor solução de monitoramento em nuvem para sua infraestrutura, conte sempre com o apoio da equipe ACSoftware.

ACSoftware / Figo Software seu Distribuidor e Revenda ManageEngine no Brasil

Fone (11) 4063 1007 – Vendas (11) 4063 9639