Health Check em TI

Health Check em TI

Afinal o que é health check?

“Health check” no sentido literal significa “exame de vida”. São verificações realizadas com objetivo de verificar se o paciente está vivo e em boas condições.
Estes exames podem variar em observações, procedimentos de exame, etc. São os famosos check-up’s de saúde 😀

E em TI?

Em Tecnologia não é diferente, a implementação de métodos de health check tem como objetivo verificar se a aplicação, código, servidor, serviço e o que mais for relevante estão vivos e bem. Os checks vão depender do que será analisado e como será analisado.

Essa metodologia pode ser aplicada em qualquer segmento de negócio de tecnologia, como desenvolvimento, Administração de Sistemas, Segurança da Informação, hardware, etc.

Por que é importante implementar health check?

Se você possui algo online e que deve permanecer desta forma, é importante que você consiga identificar quando ele tem algum downtime para que possa rapidamente atuar. Mas você pode se perguntar, mas isso não seria realizado por ferramentas de monitoração? Sim, elas geralmente são utilizadas para validar a saúde de seus serviços, mas o health check pensado em primeiro lugar você pode definir o que é critico e depois pensar em como monitora-lo, ou seja, como fazer os checks.

Visando outra vertente, como segurança, ao invés de ver somente downtime, você pode verificar a integridade, a autenticidade e outros pilares importantes para garantir a efetividade dos controles de segurança.

Por onde eu começo?

Comece listando o que é critico para você e sua organização, tente pensar em todos os ângulos que seu negócio precisa para se manter saudável, o que você tem, aonde está, o que não pode acontecer, o que deve acontecer, o que são cenários conhecidos e todo tipo de informação relevante. Exemplos:

Exemplo 1

1- O que você têm?
R: Um blog online.

2- O que não pode acontecer? (só 1 exemplo)
R: O site ficar indisponível. Entenda “site” como o conjunto dos serviços que o compõe, por exemplo, serviço de suas aplicações, como php, serviço web, como o Apache, acesso do servidor a internet, configurações de domínio, como vhosts devidamente preenchidos, etc.

3- Quais checks posso fazer?
R: Isso dependerá de sua criatividade, além do que já está presente na internet hoje, mas alguns exemplos:

  • Monitorar serviços criticos e quando não estiverem UP gerar alerta;
  • Criar uma página para ser verificada de tempos em tempos e se o resultado for diferente de 200 (sucess) gerar alerta.

Exemplo 2

1- O que você têm?
R: Um sistema PHP que realiza provisionamento de sites adicionados no painel do cliente no servidor Web.

2- O que não pode acontecer? (só 1 exemplo)
R: Os sites adicionados pelo cliente não serem configurados corretamente no servidor Web e o cliente não terem seus domínios publicados.

3- Quais checks posso fazer?
R: Isso dependerá de sua criatividade, além do que já está presente na internet hoje, mas alguns exemplos:

  • Monitorar serviços criticos e quando não estiverem UP gerar alerta;
  • Adicionar um domínio aleatório de tempos em tempos e, se após a adição o mesmo não ficar disponível, gerar um alerta.

(só 1 exemplo) = coloquei apenas um cenário básico que visa disponibilidade no primeiro exemplo e no segundo a efetividade e sucesso da aplicação, mas ambos os negócios tem outros checks que devem ser feitos.

Por fim, agradecemos a leitura e esperamos que este post tenha te ajudado de alguma maneira! Caso tenha alguma dúvida, entre em contato conosco pelo Telegram , Facebook ou Instagram ! Veja mais posts no IronLinux !

Posts relacionados

Pilha TIG (Telegraf, InfluxDB e Grafana)

Pilha TIG (Telegraf, InfluxDB e Grafana)

Como todo bom SysAdmin você precisa de uma forma eficiente de monitorar os recursos dos seus servers, certo?

Ler post completo