Auto scaling

Infraestrutura

O Auto scaling é a capacidade de um sistema de escalar automaticamente, normalmente, em termos de recursos computacionais. Com um sistema de auto scaling, os recursos são adicionados automaticamente quando necessário e podem ser dimensionados para atender às variações de demanda dos usuários. O processo de auto scaling varia e é configurável para escalar com base em diferentes métricas, como memória ou tempo de processamento. Os serviços gerenciados na nuvem geralmente estão associados à funcionalidade de auto scaling, pois há mais opções e implementações disponíveis do que a maioria das implantações no modelo on premise.

No passado, a infraestrutura e os aplicativos eram arquitetados para considerar o pico de uso do sistema. Essa arquitetura significava que mais recursos eram subutilizados e não eram flexíveis às mudanças na demanda consumida. A inflexibilidade significou custos mais altos para o negócio e perda de negócios devido a interrupções ocasionadas pela demanda excessiva de recursos.

Ao alavancar o uso da nuvem, virtualização e conteinerização de aplicações e suas dependências, as organizações podem criar aplicações que podem ser escaladas de acordo com as demandas dos usuários. Eles podem monitorar a demanda de aplicações e escala-las automaticamente, proporcionando uma experiência ideal. Considere o aumento na audiência da Netflix todas as sextas-feiras à noite. O auto scaling significa adicionar mais recursos dinamicamente: por exemplo, aumentar o número de servidores possibilitando um tempo maior de streaming de vídeo e reduzir os recursos quando o consumo for normalizado.

Comentários

Esta página foi útil?

Thank you! Please let us know if you have any suggestions.

Thanks for your feedback. Please tell us how we can improve.

Última alteração January 5, 2023: [Portuguese] Update tags to all terms (#1583) (b20e57f)