fbpx

Como diagnosticar por que seu servidor Linux travou?

Embora os servidores Linux sejam confiáveis, ocasionalmente os computadores falham. Embora uma falha ocasional do sistema possa não parecer muito, em um ambiente corporativo, é necessário diagnosticar com precisão a causa das falhas do sistema, pois uma falha do sistema pode ser um indicador de problemas significativos de software ou hardware subjacentes. Embora a solução de problemas possa ser uma tarefa difícil, usando as ferramentas mencionadas neste guia, você pode garantir que será capaz de enfrentar até mesmo os desafios mais difíceis.

Como cada servidor é diferente, este guia não pretende ajudá-lo a descobrir a causa exata de sua falha. Em vez disso, o foco está nas ferramentas que você pode usar para obter informações vitais para diagnosticar os problemas.

Gerenciamento de Processos Linux

Após uma falha do servidor, seu primeiro passo deve ser examinar todos os processos em execução em seu sistema para garantir que tudo esteja funcionando com eficiência. O comando Top embutido no Linux permite visualizar o uso da CPU, uso da memória, memória de troca, tamanho do cache, tamanho do buffer, PID do processo, usuário, comandos e muito mais. A simplicidade do Top o torna ideal para a triagem inicial de solução de problemas, pois o comando permite visualizar uma grande quantidade de informações do sistema quase que instantaneamente.

Para usar este comando, basta digitar a saída superior no console

Htop – Uma solução mais poderosa

Para facilitar seu trabalho como administrador de servidor, considere instalar essa ferramenta, pois ela aprimora suas habilidades de solução de problemas, fornecendo informações mais intuitivas do que o Top. Os principais recursos do Htop incluem uma interface codificada por cores; teclas de atalho; rolagem horizontal e vertical; e muito mais.

O Htop não é instalado em sistemas Linux por padrão, mas pode ser adicionado a sistemas baseados em CentOS e RedHat com o seguinte comando: ~ yum install htop

Nos sistemas Ubuntu, o Htop pode ser instalado com o seguinte comando: ~ sudo apt-get install htop

Analisar o tráfego de rede

Ocasionalmente, uma falha no servidor será desencadeada por problemas com o tráfego de rede. A análise eficaz de pacotes é crucial para determinar se uma falha é desencadeada por problemas no datacenter, no sistema do cliente ou mesmo diretamente no servidor.

Tcpdump

Tcpdump é uma das ferramentas de análise de pacotes de rede de linha de comando mais usadas disponíveis para sistemas Linux. É uma ferramenta vital para administradores de servidores porque permite capturar ou filtrar pacotes TCP/IP que são recebidos ou transferidos em uma interface específica em uma rede. A partir daí, o programa também permite que você salve os dados em um arquivo para análise posterior. Embora seja impraticável cobrir totalmente o uso do Tcpdump neste guia, o Tecmint.com tem um guia de início rápido disponível para os profissionais de administração de servidores usarem conforme sua conveniência.

Netstat

Quando você procura estatísticas de rede simples, o Netstat é uma ferramenta ideal para essa tarefa. Este comando pode ser usado para monitorar pacotes de rede de entrada e saída junto com a visualização de estatísticas de interface para cada dispositivo de rede. Assim como no Tcpdump, é impraticável listar aqui o número de comandos, mas o Tecmint.com tem um guia útil.

Verifique os registros

Quando tudo mais falhar, vasculhar os logs do servidor é uma das melhores maneiras de solucionar quaisquer erros. Normalmente os arquivos estarão localizados nos diretórios /var/log/syslog e /var/log/ . Infelizmente, a visualização de logs brutos geralmente é inútil porque eles geralmente contêm milhares de entradas e é impossível entender completamente os dados sem ferramentas de análise de log.

Maneiras de simplificar a análise de log

Se você estiver tentando analisar logs gerais de tráfego do servidor, ter uma ferramenta de análise de qualidade é crucial para tornar a tarefa gerenciável. Para análise de tráfego do servidor web, o AWstats é a ferramenta de escolha de muitos administradores de servidor porque é um aplicativo gratuito que transforma dados em insights gráficos. Embora o AWstats não se concentre em informações de baixo nível, como as ferramentas mencionadas anteriormente, existem algumas métricas importantes sobre as quais ele fornece informações. Com o AWstats, dados como erros de HTTP, relatórios de cluster para servidores com balanceamento de carga , logs de tráfego por hora, juntamente com relatórios de hora do rush e os endereços IP dos visitantes, são métricas cruciais para determinar os possíveis gatilhos de uma falha do servidor.

Para usuários que precisam de soluções de gerenciamento de log de alto desempenho, o Site24x7 oferece uma variedade de ferramentas adequadas para clientes corporativos que precisam resolver rapidamente os problemas do servidor. Além de monitorar servidores com mais de 60 métricas de desempenho, o Site24x7 também oferece acesso a uma ferramenta de gerenciamento de logs que facilita muito a filtragem dos dados de log.

A ferramenta de monitoramento também oferece tarefas cron, tarefas, daemons , arquivos e recursos de monitoramento de diretório, permitindo que você adote uma abordagem mais ativa da segurança.

Você pode experimentar o Site24x7 dentro da sua empresa sem custo algum. Que tal realizar esse teste agora?

Conheça na prática como o Site24x7 pode ajudar você e o seu negócio. Nossos técnicos estão disponíveis para te apresentar a melhor solução de monitoramento em nuvem para sua infraestrutura, conte sempre com o apoio da equipe ACSoftware.

ACSoftware / Figo Software seu Distribuidor e Revenda ManageEngine no Brasil

Fone (11) 4063 1007 – Vendas (11) 4063 9639

Um plano de ação de 6 pontos para empresas de software gerenciarem a crise global de escassez de chips

Desde meados de 2020, vários fatores globais, incluindo uma seca em Taiwan e a pandemia de COVID-19, resultaram em uma escassez de chips semicondutores, que piorou ainda mais à medida que a demanda por eletrônicos disparou durante a pandemia.

À medida que escritórios e escolas mudaram para residências e serviços digitais se tornaram essenciais, somente em 2020 foram vendidos 297 milhões de PCs, um aumento de 11% em relação ao ano anterior. Esses picos de mercado resultaram em um aumento de 17% na demanda de semicondutores em 2021 em relação a 2019, o que reduziu o estoque para apenas cinco dias em comparação com os 50 dias usuais. É por isso que essa situação também é chamada de choque de oferta na cadeia de valor de semicondutores.

Eletrônicos vitais, como redes 5G, dispositivos de computação em nuvem, automóveis, consoles de jogos e dispositivos médicos dependem de chips eletrônicos com densidades de componentes que variam de 800 nm a chips de 5 nm compactados usados ​​em equipamentos de alto desempenho. Apenas algumas empresas ao redor do mundo produzem a maioria dos chips, liderada pela TSMC, com sede em Taiwan, e seguida pela Samsung, Intel e outras.

Como a fabricação de semicondutores é um processo complexo, demorado, caro e trabalhoso, a crise de escassez de chips provavelmente continuará até 2023 ou 2024, até que as centenas de bilhões de dólares investidos em expansões comecem a preencher a lacuna. Enquanto algumas empresas de manufatura têm lidado com a recuperação de peças e reduzindo funcionalidades para enviar mais rapidamente, muitas paralisaram a produção por falta de chips essenciais, cujos níveis de estoque caíram, e devido ao aumento de mais de dez vezes nos preços dos componentes.

Embora os fabricantes de chips tenham começado a acelerar seus investimentos para abrir novos centros de fabricação de semicondutores, o mundo do desenvolvimento de software precisa olhar para dentro e trabalhar para otimizar o desempenho dos aplicativos. Para fazer mais com menos. Um código melhor pode compensar as inadequações de hardware extraindo mais poder de computação dos chipsets existentes, que vem da otimização de aplicativos e da minimização dos requisitos de processamento e dados.

Em sua teleconferência de resultados em julho de 2021, Elon Musk falou sobre como a Tesla conseguiu trocar chips substitutos depois de reescrever seu código de firmware para lidar com a lacuna de oferta, dando um exemplo. Até que a cadeia de suprimentos se acalme, e por mais tempo ainda, há uma necessidade de correção drástica de curso na indústria de desenvolvimento de software.

Aqui está um plano de ação de seis pontos para as empresas de software lidarem com a atual crise global de escassez de chips, concentrando-se na otimização do desempenho dos aplicativos.

  1. Mude e otimize para a nuvem: transfira o código personalizado para os servidores na nuvem se sua infraestrutura de TI local tiver dificuldades com uma carga de trabalho maior. Use algoritmos de IA para otimizar o código e reduzir os gastos na nuvem.
  2. Unifique e minimize seu código: práticas de codificação minimalistas, elegantes e enxutas aumentam a eficiência e reduzem o tempo de inatividade e os custos de reparo. Software simplificado com código enxuto ajuda a aumentar a flexibilidade no desenvolvimento de produtos. Unifique sua pilha de tecnologia e limpe processos desnecessários. Simplifique os elementos de UI ou UX para favorecer o funcionamento utilitário. Torne-se essencialista. Evite o excesso de recursos oferecendo apenas os recursos essenciais como padrão, movendo o restante para recursos opcionais.
  3. Compreender a causa raiz; não adie o inevitável: é natural adicionar recursos de computação por meio da expansão de capacidade como um paliativo para evitar atrasos em seus produtos e serviços. No entanto, isso será apenas uma correção de escalabilidade de curta duração, pois não aborda a verdadeira causa raiz: a falta de eficiência de programação. Analise sua pilha de tecnologia e resolva seus problemas de desempenho por meio de codificação eficiente e enxuta.
  4. Mude para o modo de austeridade: os desenvolvedores de software vêm construindo ofertas maiores e mais ricas em recursos com funcionalidades poderosas, assumindo que a inovação de hardware acompanhará o crescimento. Diante da realidade, os desenvolvedores agora devem mudar sua perspectiva e trabalhar para otimizar os aplicativos por meio de planejamento, execução, monitoramento e otimização rigorosos.
  5. Adote a mentalidade SaaS: conforme você expande ou otimiza, opte por construir a partir de integrações testadas pelo tempo e fáceis de implantar, com suporte de API, computação sem servidor e possibilidades de conteinerização.
  6. Aproveite o monitoramento de desempenho de aplicativos : as equipes de DevOps podem escolher soluções de monitoramento de pilha completa que oferecem observabilidade de ponta a ponta e insights poderosos sobre o desempenho de aplicativos. Uma boa solução de APM ajuda a rastrear o comportamento do aplicativo em tempo real, otimizar o tempo de resposta, entender e ajustar dependências externas, monitorar integrações personalizadas e até mesmo implantar alertas com inteligência artificial .

Em resumo, as empresas de software devem adotar uma abordagem abrangente de monitoramento para estar no topo de seu jogo – otimizar seus aplicativos para funcionar com os chips atuais por mais tempo, reduzir o bloatware, eliminar redundâncias, optar por código enxuto e mudar para a nuvem sempre que possível.

Embora a abordagem acima pareça ser o caminho a seguir até que a expansão global da cadeia de suprimentos de semicondutores se materialize, uma melhor codificação e monitoramento holístico com uma mentalidade minimalista e frugal também provará ser uma estratégia vencedora nos próximos anos.

Você pode experimentar o Site24x7 dentro da sua empresa sem custo algum. Que tal realizar esse teste agora?

Conheça na prática como o Site24x7 pode ajudar você e o seu negócio. Nossos técnicos estão disponíveis para te apresentar a melhor solução de monitoramento em nuvem para sua infraestrutura, conte sempre com o apoio da equipe ACSoftware.

ACSoftware / Figo Software seu Distribuidor e Revenda ManageEngine no Brasil

Fone (11) 4063 1007 – Vendas (11) 4063 9639

Painel de Anomalias

O Painel de Anomalias fornece previsões com explicações detalhadas sobre onde e o que causou a anomalia.

As configurações de anomalia no Site24x7 fornecem opções para adicionar limites de porcentagem de desvio para relatar anomalias. Isso ajuda a atualizar a porcentagem de desvio para obter as anomalias desejadas. A gravidade de um evento de anomalia pode ser determinada com base no desvio do valor do atributo em relação ao seu comportamento normal. O Site24x7 determina a gravidade de uma anomalia em dois níveis. 

Anomalias geradas com base na porcentagem de desvio

O primeiro nível é verificar a porcentagem, que indica o desvio do valor do atributo em relação aos valores da linha de base. Dependendo da porcentagem de desvio, uma pontuação de anomalia específica será atribuída ao evento.

  • Os clientes podem configurar uma porcentagem mínima de desvio para cada gravidade de anomalia. Essas configurações são usadas na coleta de dados para gerar anomalias com gravidades apropriadas. “Info” é a menos grave das três gravidades. Qualquer anomalia com um desvio menor do que a porcentagem mínima de desvio da gravidade da informação será descartada ou ignorada.
  • Se nenhum limite de desvio for configurado, os valores padrão nas configurações de anomalia serão exibidos e serão usados ​​para gerar anomalias.

Método de pontuação usado para gravidade da anomalia

A gravidade de uma anomalia pode ser alterada por outros eventos de anomalia correlacionados no ambiente do cliente. Por padrão, a metodologia de pontuação é habilitada para todas as anomalias. Isso pode aumentar a gravidade de uma anomalia correlacionando-a com um monitor anômalo. Se a opção de metodologia de pontuação estiver desativada, a gravidade será atribuída a uma anomalia apenas com base nas configurações de porcentagem de desvio.

Configurações de anomalia

Configure a porcentagem de desvio para cada gravidade para gerar anomalias.

  • Desvio de gravidade de informação : O desvio de gravidade de informação representa a porcentagem mínima de desvio. Escolha o percentual de desvio ou, caso não esteja configurando nenhum valor, será escolhido o percentual de desvio mínimo padrão (20 por cento).
  • Desvio de gravidade provável : O desvio provável representa a porcentagem de desvio médio. Escolha o percentual de desvio ou, caso não esteja configurando nenhum valor, será escolhido o percentual de desvio mínimo padrão (50 por cento).
  • Desvio de gravidade confirmado : O desvio de gravidade confirmado representa a porcentagem máxima de desvio. Escolha o percentual de desvio ou, caso não esteja configurando nenhum valor, será escolhido o percentual de desvio mínimo padrão (80 por cento).

Método de pontuação

Aplique a metodologia de pontuação para determinar a gravidade da anomalia : Escolha sim se desejar aplicar o método de pontuação.

Você pode experimentar o Site24x7 dentro da sua empresa sem custo algum. Que tal realizar esse teste agora? Clique aqui e comece agora mesmo!

Conheça na prática como o Site24x7 pode ajudar você e o seu negócio. Nossos técnicos estão disponíveis para te apresentar a melhor solução de monitoramento em nuvem para sua infraestrutura, conte sempre com o apoio da equipe ACSoftware.

ACSoftware / Figo Software seu Distribuidor e Revenda ManageEngine no Brasil

Fone (11) 4063 1007 – Vendas (11) 4063 9639

Chatbots baseados em PNL para operações de TI

A partir da criação do Processamento de Linguagem Natural (PLN), tudo pode ficar muito simples e amigável para os usuários.

O estudo realizado através do PLN – subárea da Inteligência Artificial – busca compreender o ponto máximo de capacidade de uma máquina, no que diz respeito a compor e interpretar a comunicação humana (seja em textos escritos ou falados).

o PLN auxilia a máquina na interpretação da fala quando há duplo sentido, alterações no tom de voz, possíveis desorganizações das palavras em uma frase, entre muitas outras características. Também, com seus pré-processamentos, estrutura a língua apropriando-se apenas das informações relevantes, reduzindo os dados do vocabulário em prol da objetividade.

Como funciona tudo isso nos chatbots?

A grande diferença entre assistentes baseados em scripts daqueles que são construídos com PLN está na interação. Nos primeiros, há informações pré-determinadas que engessam o fluxo conversacional, não raramente levando o usuário a frustrar-se por não ter sua necessidade atendida. Já nos segundos, há um processo de “treinamento” dos bots, visando a interpretação de intenção, o que resulta em uma entrega de respostas coerentes que levam a caminhos mais certeiros.

Se você precisar de aconselhamento especializado enquanto monitora seus recursos, os chatbots baseados em processamento de linguagem natural do Site24x7, construídos em uma plataforma avançada de IA, podem ajudar. Basta enviar uma pergunta e receber respostas instantâneas usando entradas de diálogo simples de plataformas de colaboração como Microsoft Teams e Zoho Cliq.

 As equipes de DevOps podem usar o ChatOps no Microsoft Teams para simplificar as tarefas de monitoramento de TI e gerenciamento de incidentes. Um ótimo exemplo seria o chatbot Site24x7 no Microsoft Teams. É um assistente de monitoramento automatizado e personalizado construído na estrutura de processamento de linguagem natural do Site24x7 que usa entradas de diálogo e outros elementos interativos em vez de comandos de texto simples.

As equipes de DevOps podem fazer perguntas relacionadas ao monitor do chatbot e obter respostas precisas sobre disponibilidade, desempenho, interrupções, acordos de nível de serviço e alarmes em tempo real. As equipes de DevOps podem reduzir drasticamente seu MTTR usando um chatbot para monitorar sua TI e resolver incidentes. 

Por que escolher o Site24x7

O Site24x7, com seus recursos estatísticos de ML(aprendizado de máquina) e mais de 10 anos de pesquisa de IA da Zoho, processa mais de um bilhão de solicitações por mês em relação a IA e ML.

Modelos de configuração de dados baixos

O Site24x7, com seus recursos estatísticos de ML e mais de 10 anos de pesquisa de IA da Zoho, processa mais de um bilhão de solicitações por mês em relação a IA e ML.

Explicação pronta

O Painel de Anomalias fornece previsões com explicações detalhadas sobre onde e o que causou a anomalia.

Privacidade amigável

Os modelos de IA do Site24x7 são amigáveis ​​à privacidade com coleta e processamento de dados transparentes.

Você pode experimentar o Site24x7 dentro da sua empresa sem custo algum. Que tal realizar esse teste agora? Entre em contato com nossa equipe e comece agora mesmo!

Conheça na prática como o Site24x7 pode ajudar você e o seu negócio. Nossos técnicos estão disponíveis para te apresentar a melhor solução de monitoramento em nuvem para sua infraestrutura, conte sempre com o apoio da equipe ACSoftware.

ACSoftware / Figo Software seu Distribuidor e Revenda ManageEngine no Brasil

Fone (11) 4063 1007 – Vendas (11) 4063 9639