Engenharia de Confiabilidade de Sites

Engenharia de Confiabilidade de Sites (do inglês Site Reliability Engineering - SRE) é uma disciplina que combina operações e engenharia de software. Este último é aplicado especificamente a problemas de infraestrutura e operações. Ou seja, em vez de criar recursos do produto, os Engenheiros de Confiabilidade criam sistemas para rodar aplicativos. Existem semelhanças com o DevOps, mas enquanto o DevOps se concentra em colocar o código em produção, o SRE garante que o código em execução na produção funcione corretamente.

Problema relacionado

Garantir que os aplicativos sejam executados de forma confiável requer vários recursos, desde monitoramento de desempenho, alerta, depuração até solução de problemas. Sem isso, os operadores do sistema só podem reagir a problemas vs. trabalhar proativamente para evitá-los - o tempo de inatividade só se torna uma questão de tempo.

Como isso ajuda

Uma abordagem SRE minimiza o custo, o tempo e o esforço do processo de desenvolvimento de software, melhorando continuamente. O sistema mede e monitora continuamente a infraestrutura e os componentes da aplicação. Quando algo dá errado, o sistema aponta os Engenheiros de Confiabilidade para quando, onde e como corrigi-lo. Essa abordagem ajuda a criar sistemas de software altamente escaláveis e confiáveis, automatizando tarefas operacionais.


Última alteração December 3, 2023: [pt] Remove the "What it is" header (#2668) (a83e5b0)