Auto scaling

O Auto scaling é a capacidade de um sistema de escalar automaticamente, normalmente, em termos de recursos computacionais. Com um sistema de auto scaling, os recursos são adicionados automaticamente quando necessário e podem ser dimensionados para atender às variações de demanda dos usuários. O processo de auto scaling varia e é configurável para escalar com base em diferentes métricas, como memória ou tempo de processamento. Os serviços gerenciados na nuvem geralmente estão associados à funcionalidade de auto scaling, pois há mais opções e implementações disponíveis do que a maioria das implantações no modelo on premise.

No passado, a infraestrutura e os aplicativos eram arquitetados para considerar o pico de uso do sistema. Essa arquitetura significava que mais recursos eram subutilizados e não eram flexíveis às mudanças na demanda consumida. A inflexibilidade significou custos mais altos para o negócio e perda de negócios devido a interrupções ocasionadas pela demanda excessiva de recursos.

Ao alavancar o uso da nuvem, virtualização e conteinerização de aplicações e suas dependências, as organizações podem criar aplicações que podem ser escaladas de acordo com as demandas dos usuários. Eles podem monitorar a demanda de aplicações e escala-las automaticamente, proporcionando uma experiência ideal. Considere o aumento na audiência da Netflix todas as sextas-feiras à noite. O auto scaling significa adicionar mais recursos dinamicamente: por exemplo, aumentar o número de servidores possibilitando um tempo maior de streaming de vídeo e reduzir os recursos quando o consumo for normalizado.


Última alteração January 5, 2023: [Portuguese] Update tags to all terms (#1583) (b20e57f)