fbpx

Alertas e relatórios com inteligência artificial

Evite possíveis catástrofes com alertas alimentados por IA. O Site24x7 tem um mecanismo de detecção de anomalias, alimentado por técnicas de aprendizado de máquina e previsão, detecta qualquer comportamento incomum ou picos no desempenho de seu aplicativo e notifica você imediatamente. Isso ajuda você a tomar medidas corretivas antes que seus clientes sejam afetados.

Detecção de anomalia

A detecção de anomalias é o processo de identificação de eventos inesperados ou observações que se desviam significativamente da norma. Também é conhecido como detecção ou análise de outliers.

Um sistema de detecção de anomalias ajuda a prever a degradação do serviço em um ambiente de TI cada vez mais complexo usando insights baseados em IA e ML. Obtenha visibilidade incomparável dos desafios de desempenho e reduza o tempo médio de reparo (MTTR) usando a ferramenta de monitoramento com inteligência artificial do Site24x7.

Detecção de anomalias usando aprendizado de máquina e IA

A detecção de anomalias com inteligência artificial e ML conecta diferentes pontos de dados usando algoritmos críticos, entende as tendências e a sazonalidade e identifica problemas em tempo real. O monitoramento com inteligência artificial do Site24x7 para operações de DevOps e TI oferece os seguintes benefícios:

Alerta proativo de recursos não autorizados

A detecção em tempo real de desvios ou picos incomuns nas métricas de desempenho ajuda você a manter a integridade de seus serviços e ficar à frente do tempo de inatividade.

Simplifique a análise de causa raiz (RCA)

Identifique as dependências entre variações individuais nas métricas de desempenho e vários tipos de monitor, tornando mais simples identificar a origem do problema que levou à cadeia de ocorrências de tempo de inatividade.

Comportamento de monitor de alinhamento automático de ambientes dinâmicos

Supere os limites de limites estáticos para reduzir alertas falsos em seu ambiente dinâmico. O aprendizado automático ajuda o sistema a criar uma linha de base confiável para desempenho sem intervenção manual.

Simplifique a análise de causa raiz (RCA)

Identifique as dependências entre variações individuais nas métricas de desempenho e vários tipos de monitor, tornando mais simples identificar a origem do problema que levou à cadeia de ocorrências de tempo de inatividade.

Comportamento de monitor de alinhamento automático de ambientes dinâmicos

Supere os limites de limites estáticos para reduzir alertas falsos em seu ambiente dinâmico. O aprendizado automático ajuda o sistema a criar uma linha de base confiável para desempenho sem intervenção manual.

Detecção de anomalias em todas as facetas do monitoramento

Descubra a degradação do tempo de resposta regional em seu site

Um pico de tempo de resposta pode ser limitado a uma única região específica devido a problemas com o ISP ou o CDN. Reduza o escopo do problema com detalhes específicos da região e evite rapidamente possíveis desastres.

Detectar ataques de negação de serviço (DoS)

Aberrações nos parâmetros de taxa de transferência de solicitação e taxa de transferência de dados de um aplicativo indicam um possível ataque DoS em seu site. Identifique as ameaças no momento em que elas começam e evite danos ao seu site e à imagem da sua marca.

Identifique conexões e aplicativos de sites lentos

Identifique aumento nos valores de tempo de conexão para identificar atrasos nas conexões com o servidor web. O tempo de conexão de um site é um parâmetro crucial para ficar de olho. Uma solicitação lenta afetará todas as solicitações que a seguem na fila, resultando em erros de tempo limite de conexão. Isso também pode afetar o desempenho geral do aplicativo.

Você pode experimentar o Site24x7 dentro da sua empresa sem custo algum. Que tal realizar esse teste agora? Entre em contato com nossa equipe e comece agora mesmo!

Conheça na prática como o Site24x7 pode ajudar você e o seu negócio. Nossos técnicos estão disponíveis para te apresentar a melhor solução de monitoramento em nuvem para sua infraestrutura, conte sempre com o apoio da equipe ACSoftware.

ACSoftware / Figo Software seu Distribuidor e Revenda ManageEngine no Brasil

Fone (11) 4063 1007 – Vendas (11) 4063 9639

Detecção de anomalias com IA

Uma anomalia é algo que foge da norma. É um ponto de dados que difere de outras observações. As anomalias também são conhecidas como outliers. Anomalias podem ocorrer em bancos de dados e servidores. Em termos de monitoramento, uma anomalia é um desvio significativo de como uma métrica geralmente se comporta ou se comportava no passado. As anomalias podem ser um aumento repentino no tráfego do site, um aumento acentuado no tempo de resposta do aplicativo ou uma conexão do site mais lenta.

O que é detecção de anomalias

A detecção de anomalias é o processo de identificação de qualquer desvio do comportamento normal. Pode ser uma indicação de uma falha técnica ou uma brecha em potencial para ataques. Com o monitoramento de TI, a detecção de anomalias ocorre quando uma métrica se comporta de maneira diferente quando comparada a como geralmente se comportava ou como se comportava no passado.

A detecção de anomalias leva em consideração as tendências sazonais, incluindo certas horas do dia, dias da semana e meses do ano durante os quais qualquer desvio da norma é típico. É crítico em áreas onde as anomalias são menos prováveis ​​de acontecer e quando os padrões recorrentes não são fáceis de monitorar sem anomalias adequadas e alertas baseados em limites implementados.

Como a IA e o ML ajudam na detecção de anomalias

O motor AI e ML estuda o comportamento ao longo de um período prescrito para compreender os padrões regulares. Com base nesses insights, ele identifica quando há um desvio do comportamento observado e o notifica sobre isso. O motor AI e ML também prevê tendências futuras com base nessas observações.

Um sistema de detecção de anomalias ajuda a aproveitar o poder da IA ​​e do ML para prever a degradação do serviço em um ambiente de TI cada vez mais complexo.

Por que os sites precisam de um sistema de detecção de anomalias

Os sites têm muitas tecnologias por trás deles que podem dar errado. De erros de Javascript a erros de HTML, plug-ins, problemas de CDN e sites SSL estão sujeitos a vários erros. Também podem ocorrer problemas de ISP da Internet sobre os quais você não tem muito controle. Além disso, novos padrões e tecnologias para acompanhar podem torná-lo mais opressor. Portanto, um sistema automatizado de detecção de anomalias que pode fornecer informações sobre a varredura de todos esses parâmetros pode ajudar.

Como o Site24x7 ajuda na detecção de anomalias

A estrutura de anomalias alimentada por IA do Site24x7 usa a Robust Principal Component Analysis (RPCA) e algoritmos de esboço de matriz para detectar anomalias. A ferramenta de detecção de anomalias do Site24x7 envolve modelagem matemática, geração de eventos de anomalias e pontuação de domínio.

Ele identifica as principais anomalias na velocidade do site, tempo de resposta do aplicativo, atraso na conexão do servidor da web, memória do servidor e métricas de disco, utilização da largura de banda da rede e principais métricas de desempenho da AWS. O mecanismo de AI e ML estuda os padrões comuns, levando em consideração as tendências sazonais, e gera alertas sempre que uma anomalia é observada. O Site24x7 também permite que você configure limites baseados em anomalias e receba alertas por e-mail, chamada de voz, SMS ou ferramenta ITSM de terceiros.

Por que o Site24x7 é o melhor sistema de detecção de anomalias

As técnicas de detecção de anomalias de classe empresarial do Site24x7 permitem que os usuários monitorem no nível do sistema, aplicativo e código para entender padrões, identificar anomalias e prever tendências futuras. Com o Site24x7, você pode:

  • Monitorar todos os seus recursos de TI de sites, servidores, redes, aplicativos e serviços em nuvem em um só lugar
  • Melhorar a segurança do seu sistema monitorando, identificando e corrigindo anomalias
  • Usar o painel de anomalias para visualizar todas as anomalias.
  • Gerar relatórios de anomalias e compartilha-los com sua equipe nos formatos CSV ou PDF por e-mail
  •  Receber alertas de limite baseados em anomalias por e-mail, chamada de voz, SMS e sua ferramenta ITSM de terceiros. 

Monitoramento alimentado por IA para DevOps e operações de TI com alerta proativo de recursos invasores

A detecção em tempo real de desvios ou picos incomuns nas métricas de desempenho ajuda a manter a integridade de seus serviços e ficar à frente do tempo de inatividade.

Simplifique a análise de causa raiz (RCA)

Identifique dependências entre variações individuais nas métricas de desempenho e vários tipos de monitor, tornando mais simples identificar a origem do problema que levou à cadeia de ocorrências de tempo de inatividade.

Comportamento de monitor de alinhamento automático em ambientes dinâmicos

Supere os limites dos limites estáticos para reduzir alertas falsos em seu ambiente dinâmico. O aprendizado automático ajuda o sistema a construir uma linha de base confiável para desempenho sem intervenção manual.

Detecção de anomalias em todas as facetas de monitoramento

Descubra a degradação do tempo de resposta regional em seu site, um pico de tempo de resposta pode ser limitado a uma única região específica devido a problemas com o ISP ou o CDN. Limite o escopo do problema com detalhes específicos da região e evite desastres em potencial rapidamente.

Detectar ataques de negação de serviço (DoS)

Abberrations nos parâmetros de taxa de transferência de solicitação de um aplicativo e de taxa de transferência de dados indicam um possível ataque DoS em seu site. Identifique as ameaças no momento em que elas começam e evite danos ao seu site e à imagem da marca.

Identificar conexões e aplicativos de sites mais lentos

Identifique o aumento nos valores de tempo de conexão para apontar atrasos nas conexões com o servidor web. O tempo de conexão de um site é um parâmetro crucial a ser observado. Uma solicitação lenta afetará todas as solicitações seguintes na fila, resultando em erros de tempo limite de conexão. Isso também pode afetar o desempenho geral do aplicativo.

Previsão para métricas críticas

Identifique picos de memória e prever o uso do disco. Faça a distinção entre picos de memória que ocorrem devido à falta de armazenamento e um grande volume de conexões com o servidor. Selecione os eventos que realmente afetam suas operações comerciais com base na temporada ou tendência. Você também pode visualizar a previsão de uso do disco em seus servidores e recursos VMware para a próxima semana para um melhor planejamento de capacidade.

Prever o uso de métricas de desempenho da AWS

O uso de modelos de previsão de série como suavização exponencial do motor AI do Site24x7 pode prever o uso de métricas para vários serviços, como EC2, RDS, EBS e ELB. Veja a lista completa aqui.

Obtenha visibilidade incomparável dos desafios de desempenho e reduza o tempo médio de reparo (MTTR) usando a ferramenta de monitoramento all-in-one com IA do Site24x7.

Conheça na prática como o Site24x7 pode ajudar você e o seu negócio. Nossos técnicos estão disponíveis para te apresentar a melhor solução de monitoramento em nuvem para sua infraestrutura, conte sempre com o apoio da equipe ACSoftware.

ACSoftware / Figo Software seu Distribuidor e Revenda ManageEngine no Brasil

Fone (11) 4063 1007 – Vendas (11) 4063 9639

Relatórios de anomalias com IA para as operações de TI

A Inteligência Artificial é um sistema que pode realizar tarefas de forma autônoma e sem supervisão humana, podendo acessar e analisar um alto volume de dados em segundos.

A transformação digital tem exigido cada vez mais uma mudança de posicionamento e estratégia em todos os âmbitos dos negócios, com a IA é possível ter mais rapidez e desempenho.

Como o volume de dados só tende a aumentar com o passar do tempo, o gerenciamento de infraestrutura deve acompanhar esse ritmo, exigindo ferramentas cada vez mais velozes que acompanhem o ritmo dos negócios modernos, em que os problemas precisam ser corrigidos imediatamente para que o fluxo das operações e a experiência do usuário não seja afetada. 

Gráficos, relatórios e painéis do Site24x7 auxiliam as equipes na visualização e acompanhamento dos eventos, facilitando a tomada de decisões e a prevenção de eventos. Trazendo resultados mais satisfatórios e ágeis nas tomadas de decisão, trabalhando com análise inteligente dos dados e métricas personalizadas, atuando melhor na prevenção de riscos.

Todos os seus KPIs são comparados com os valores de referência sazonais. O Relatório de anomalias ajuda a ajustar o desempenho de seus recursos e proteger sua infraestrutura de quaisquer problemas imprevistos. Você pode compartilhar anomalias com sua equipe gerando um CSV, PDF ou via e-mail. 

A ideia por trás da detecção de anomalias em uma métrica que está sendo monitorada é identificar quaisquer picos ou alterações incomuns em uma determinada série. Qualquer medida de monitoramento para a qual a detecção de anomalias deve ser ativada é tratada como uma série de tempo em que é pesquisada em relação ao tempo em intervalos uniformes. Dependendo de certas desigualdades matemáticas que são estáticas, não daria resultados contextualmente consistentes a longo prazo. A Inteligência Artificial (IA) pode resolver isso com uma abordagem que visa detectar uma anomalia, logo após sua ocorrência.

Uma abordagem baseada em IA:

  • Suavização de tendências : o tratamento de tendências captura a direção geral do padrão (aumento ou queda)
  • Lidando com Sazonalidade: É a estrutura padrão que continua se repetindo mais ou menos em cada período de tempo
  • Robustez : torna-o imune a picos de desempenho insignificantes.

Prever tendências com o Anomaly Engine

O ciclo do mecanismo de anomalia consiste em vários estágios que incluem o processamento de dados de entrada de coletores de dados contra os dados de treinamento de IA para gerar uma anomalia confirmada para notificar a própria anomalia. O Anomaly Engine possui um modelo de comparação quantitativa e qualitativa para detecção de anomalias. A previsão com o Anomaly Engine envolve duas etapas:

  1. Geração de evento de anomalia
  2. Pontuação de domínio para determinar a gravidade da anomalia

Geração de evento de anomalia

O objetivo principal desta etapa é realizar o processamento de peso pesado e gerar “ Eventos ”. O mecanismo de detecção de anomalias coleta as métricas a cada 15 minutos dos agentes coletores de dados Site24x7. Para detecção de anomalia univariada, esses dados são comparados com os dados de treinamento do modelo de aprendizado de máquina, que são os respectivos valores do 95º percentil por hora do dia das últimas quatro semanas. Por exemplo, se os dados de sexta-feira forem enviados para detecção de anomalias, os valores das últimas 4 semanas de sexta-feira serão considerados como dados de treinamento para o modelo de aprendizado de máquina. Isso ajuda a atingir a sazonalidade dos dados. Os 95º percentis dos dados são considerados para treinamento a fim de remover os valores extremos presentes (no 95º percentil, os 5% dos valores mais altos são removidos, o que também removerá quaisquer picos incomuns nos dados de treinamento).

Para detecção de anomalias multivariadas, os agentes de coleta de dados do Site24x7 enviam novamente os dados para a plataforma de detecção de anomalias a cada 15 minutos. Os valores de 95º percentil das últimas quatro semanas para atributos correlacionados são usados ​​para treinar o algoritmo. Se a combinação for detectada como uma anomalia, serão determinados os atributos que contribuem para que a combinação seja uma anomalia.

Com base na comparação com os dados de treinamento, os eventos são então gerados e definidos como valores L1, L2 e L3, com os  valores L3 tendo a maior chance de ser uma anomalia.

Pontuação de domínio para determinar a gravidade da anomalia

Este estágio adiciona um modelo qualitativo à geração de anomalias, considerando também as anomalias vistas em monitores dependentes. Os eventos somam e dão uma pontuação com base na qual a “ Gravidade da anomalia ” é decidida. Quando uma tarefa de pontuação de anomalia é agendada após a ocorrência da anomalia, o mecanismo de anomalia verifica se houve alguma anomalia para algum monitor dependente durante os últimos 30 minutos. As pontuações são dadas a monitores individuais com base nos atributos que causam a anomalia do monitor e a porcentagem de desvio desses atributos dos valores esperados.

As seguintes metodologias (na mesma ordem especificada abaixo) são geralmente consideradas para a determinação da pontuação final:

  • Outro atributo do mesmo monitor detectado como anômalo
  • Monitores dependentes detectados com anomalia
  • Monitores pais / filhos são anômalos
  • Monitores, agrupados no mesmo Grupo de Monitores detectados como anômalos
  • Outro monitor com as mesmas tags (tags definidas pelo usuário) apresenta anomalia
  • Monitores com o mesmo nome de servidor / mesmo nome de domínio totalmente qualificado (FQDN) apresentam anomalia

Finalmente, com base em fatores como pontuações de domínio, dependências e gravidade crescente da anomalia detectada , a gravidade de uma anomalia é segmentada em três:

  • Anomalia confirmada: evidencia uma tendência negativa que ocorre de forma persistente. Quando uma anomalia confirmada se repete por um período mais longo, ela claramente o orienta para uma situação de interrupção imediata e inevitável. Conseqüentemente, a anomalia repetitiva confirmada precisa de sua máxima atenção.
  • Provável anomalia: você deve acompanhar de perto essa tendência, pois ela pode levar a uma situação de interrupção no longo prazo.
  • Informação: Esta é apenas uma notificação para o usuário e deve ser monitorada de perto, a fim de amenizar quaisquer problemas futuros.

Perfis de limite baseados em AI

O perfil de limite baseado em AI usa detecção de anomalias para determinar o status de um monitor. É uma abordagem de limite dinâmico, ao contrário dos limites estáticos usados ​​atualmente. Nos perfis de limite estático atuais, você terá que definir limites codificados para determinar o status de um monitor. Em caso de qualquer problema, você será notificado apenas quando os limites definidos forem violados.

Para limites baseados em IA, você não poderá definir nenhum limite codificado. Em vez disso, teremos limites dinâmicos que serão atualizados de acordo com o comportamento do monitor. Portanto, em caso de qualquer problema, o cliente será notificado imediatamente assim que o problema começar, em vez de esperar que o limite estático seja violado. Além de ser dinâmico, isso elimina a necessidade de definir estratégias de votação. As estratégias de votação são essenciais para evitar picos intermitentes. Em caso de detecção de anomalias, o bursting de pico é feito para evitar relatar picos intermitentes como anomalias. Conseqüentemente, estratégias de pesquisa codificadas podem ser evitadas.

Interpretar painel de anomalias

O Anomaly Dashboard permite decodificar facilmente quaisquer tendências negativas em sua infraestrutura de TI com antecedência. Você pode localizar e filtrar as anomalias com base no monitor ou na seleção do grupo de monitores.

Use o  seletor de Período de tempo  para selecionar um intervalo de tempo que varia de ” Últimas 1, 6, 12, 24 horas até um ano atrás “.

Além disso, você pode categorizar anomalias com base nos vários níveis de gravidade, como “Confirmado, Provável e Informações”. 

Assim que o painel for gerado, você pode clicar no botão Compartilhar este mostrado no canto superior direito para compartilhar o relatório por e-mail, gerar um CSV ou PDF para compartilhá-lo com seus colegas de equipe. O e-mail pode ser enviado apenas para os usuários verificados que concordaram em receber e-mails do Site24x7.

O painel oferece uma visualização dividida, onde todos os seus monitores e grupos de monitores podem ser vistos no lado esquerdo do painel.

Todas as anomalias listadas terão seu sinalizador de gravidade relevante em relação à mensagem de anomalia. Esta descrição da anomalia permite reunir detalhes detalhados sobre a tendência da anomalia. Para obter mais informações sobre a causa raiz dos problemas de desempenho, clique no hiperlink fornecido junto com a descrição da anomalia.

Passe o mouse sobre o gráfico de linha para visualizar o valor real da métrica para a data e hora específicas. O valor da métrica padrão pode variar de monitor para monitor. Cada monitor terá um ou mais atributos padrão para os quais a detecção de anomalias será habilitada . No entanto, além disso, você também pode usar o menu suspenso acima do gráfico de linha para visualizar outros atributos de desempenho do monitor selecionado, durante o mesmo intervalo de tempo.

Depois de clicar no  link Conheça a causa raiz de uma mensagem específica do Anomaly, você verá uma janela pop-up modal onde poderá localizar um gráfico de linha com os valores da métrica rastreados nas últimas quatro semanas.

Conheça na prática como o Site24x7 pode ajudar você e o seu negócio. Nossos técnicos estão disponíveis para te apresentar a melhor solução de monitoramento em nuvem para sua infraestrutura, conte sempre com o apoio da equipe ACSoftware.

ACSoftware / Figo Software seu Distribuidor e Revenda ManageEngine no Brasil

Fone (11) 4063 1007 – Vendas (11) 4063 9639