fbpx

Como diagnosticar por que seu servidor Linux travou?

Daniella Costa

Como diagnosticar por que seu servidor Linux travou?

Embora os servidores Linux sejam confiáveis, ocasionalmente os computadores falham. Embora uma falha ocasional do sistema possa não parecer muito, em um ambiente corporativo, é necessário diagnosticar com precisão a causa das falhas do sistema, pois uma falha do sistema pode ser um indicador de problemas significativos de software ou hardware subjacentes. Embora a solução de problemas possa ser uma tarefa difícil, usando as ferramentas mencionadas neste guia, você pode garantir que será capaz de enfrentar até mesmo os desafios mais difíceis.

Como cada servidor é diferente, este guia não pretende ajudá-lo a descobrir a causa exata de sua falha. Em vez disso, o foco está nas ferramentas que você pode usar para obter informações vitais para diagnosticar os problemas.

Gerenciamento de Processos Linux

Após uma falha do servidor, seu primeiro passo deve ser examinar todos os processos em execução em seu sistema para garantir que tudo esteja funcionando com eficiência. O comando Top embutido no Linux permite visualizar o uso da CPU, uso da memória, memória de troca, tamanho do cache, tamanho do buffer, PID do processo, usuário, comandos e muito mais. A simplicidade do Top o torna ideal para a triagem inicial de solução de problemas, pois o comando permite visualizar uma grande quantidade de informações do sistema quase que instantaneamente.

Para usar este comando, basta digitar a saída superior no console

Htop – Uma solução mais poderosa

Para facilitar seu trabalho como administrador de servidor, considere instalar essa ferramenta, pois ela aprimora suas habilidades de solução de problemas, fornecendo informações mais intuitivas do que o Top. Os principais recursos do Htop incluem uma interface codificada por cores; teclas de atalho; rolagem horizontal e vertical; e muito mais.

O Htop não é instalado em sistemas Linux por padrão, mas pode ser adicionado a sistemas baseados em CentOS e RedHat com o seguinte comando: ~ yum install htop

Nos sistemas Ubuntu, o Htop pode ser instalado com o seguinte comando: ~ sudo apt-get install htop

Analisar o tráfego de rede

Ocasionalmente, uma falha no servidor será desencadeada por problemas com o tráfego de rede. A análise eficaz de pacotes é crucial para determinar se uma falha é desencadeada por problemas no datacenter, no sistema do cliente ou mesmo diretamente no servidor.

Tcpdump

Tcpdump é uma das ferramentas de análise de pacotes de rede de linha de comando mais usadas disponíveis para sistemas Linux. É uma ferramenta vital para administradores de servidores porque permite capturar ou filtrar pacotes TCP/IP que são recebidos ou transferidos em uma interface específica em uma rede. A partir daí, o programa também permite que você salve os dados em um arquivo para análise posterior. Embora seja impraticável cobrir totalmente o uso do Tcpdump neste guia, o Tecmint.com tem um guia de início rápido disponível para os profissionais de administração de servidores usarem conforme sua conveniência.

Netstat

Quando você procura estatísticas de rede simples, o Netstat é uma ferramenta ideal para essa tarefa. Este comando pode ser usado para monitorar pacotes de rede de entrada e saída junto com a visualização de estatísticas de interface para cada dispositivo de rede. Assim como no Tcpdump, é impraticável listar aqui o número de comandos, mas o Tecmint.com tem um guia útil.

Verifique os registros

Quando tudo mais falhar, vasculhar os logs do servidor é uma das melhores maneiras de solucionar quaisquer erros. Normalmente os arquivos estarão localizados nos diretórios /var/log/syslog e /var/log/ . Infelizmente, a visualização de logs brutos geralmente é inútil porque eles geralmente contêm milhares de entradas e é impossível entender completamente os dados sem ferramentas de análise de log.

Maneiras de simplificar a análise de log

Se você estiver tentando analisar logs gerais de tráfego do servidor, ter uma ferramenta de análise de qualidade é crucial para tornar a tarefa gerenciável. Para análise de tráfego do servidor web, o AWstats é a ferramenta de escolha de muitos administradores de servidor porque é um aplicativo gratuito que transforma dados em insights gráficos. Embora o AWstats não se concentre em informações de baixo nível, como as ferramentas mencionadas anteriormente, existem algumas métricas importantes sobre as quais ele fornece informações. Com o AWstats, dados como erros de HTTP, relatórios de cluster para servidores com balanceamento de carga , logs de tráfego por hora, juntamente com relatórios de hora do rush e os endereços IP dos visitantes, são métricas cruciais para determinar os possíveis gatilhos de uma falha do servidor.

Para usuários que precisam de soluções de gerenciamento de log de alto desempenho, o Site24x7 oferece uma variedade de ferramentas adequadas para clientes corporativos que precisam resolver rapidamente os problemas do servidor. Além de monitorar servidores com mais de 60 métricas de desempenho, o Site24x7 também oferece acesso a uma ferramenta de gerenciamento de logs que facilita muito a filtragem dos dados de log.

A ferramenta de monitoramento também oferece tarefas cron, tarefas, daemons , arquivos e recursos de monitoramento de diretório, permitindo que você adote uma abordagem mais ativa da segurança.

Você pode experimentar o Site24x7 dentro da sua empresa sem custo algum. Que tal realizar esse teste agora?

Conheça na prática como o Site24x7 pode ajudar você e o seu negócio. Nossos técnicos estão disponíveis para te apresentar a melhor solução de monitoramento em nuvem para sua infraestrutura, conte sempre com o apoio da equipe ACSoftware.

ACSoftware / Figo Software seu Distribuidor e Revenda ManageEngine no Brasil

Fone (11) 4063 1007 – Vendas (11) 4063 9639