Resumen

El auto escalamiento (autoscaling) nos permite escalar la capacidad de nuestras instancias de máquinas virtuales automáticamente, de acuerdo con nuestras condiciones definidas.

Podemos aumentar la cantidad de instancias que tenemos en ejecución durante los picos de demanda y disminuirlos cuando no los necesitemos. Esto trae una alta disponibilidad, tolerancia a fallos y un ahorro de costos.

Pasos para aplicar autoescalamiento

  1. Para aprovechar el autoescalamiento, debemos crear un grupo de auto escalamiento que asocie nuestras instancias.
  2. En este grupo especificaremos un tamaño mínimo (el número mínimo de instancias a correr), y una capacidad deseada (el número óptimo de instancias en función de las necesidades).
  3. Entonces se agregarán más instancias según sea necesario hasta alcanzar un máximo.

Cabe destacar que el Load Balancer de AWS es lo que permite distribuir automaticamente las conexiones a medida que aparecen y desaparecen estos servidores.

Nota: EC2 no es el único servicio que tiene auto escalamiento. DynamoDB y Aurora también implementan este concepto.

Contribución creada con aportes de: Ciro Villafraz y Christian Andres Moreno Ceballos.