Autoescalamiento en AWS: Gestión Dinámica de Recursos en la Nube

Clase 25 de 80 • Curso AWS Cloud Practitioner Certification

Contenido del curso

Fundamentos de la Infraestructura Global de AWS

Redes en AWS

Servicios de cómputo en AWS

Balanceo de Carga y Auto escalamiento

Almacenamiento en AWS

Bases de datos en AWS

Seguridad en AWS

Costos en AWS

Servicios Complementarios

Migracion a la nube de AWS

Cómo aprobar la certificación AWS Cloud Practitioner

Tomar examen

Resumen

Imagina que tienes un e-commerce y se acerca el Black Friday. Miles de usuarios quieren comprar al mismo tiempo y tu infraestructura debe responder sin caerse. Aquí es donde el autoescalamiento se convierte en tu mejor aliado dentro de AWS, permitiendo que tus servidores crezcan y decrezcan según la demanda real, ajustando costos de forma automática.

¿Qué es el autoescalamiento y por qué lo necesitas?

El servicio EC2 Auto Scaling de Amazon permite que tu aplicación agregue o elimine servidores de forma automática según la carga de trabajo [0:14]. En lugar de mantener una cantidad fija de servidores, el sistema detecta cuándo la demanda sube y crea nuevas instancias, y cuando la demanda baja, las elimina.

Esto resuelve dos problemas críticos:

Disponibilidad: tu aplicación soporta picos de tráfico sin caerse.
Optimización de costos: no pagas por capacidad que no estás usando.

Piensa en el ejemplo del Black Friday [0:25]. Originalmente tienes un servidor, pero necesitas atender cientos de miles de usuarios. Con autoescalamiento puedes pasar a cincuenta servidores durante el pico y volver a la capacidad original cuando termina la promoción. Los costos se ajustan proporcionalmente.

¿Cómo funciona el autoescalamiento con CloudWatch y el balanceador de carga?

El proceso parte de un escenario real: tienes dos servidores (A y B) detrás de un balanceador de carga atendiendo cien usuarios [2:20]. De pronto, el tráfico salta a diez mil usuarios. Esos dos servidores no pueden más.

¿Qué papel juega CloudWatch en el proceso?

CloudWatch es el servicio de monitoreo que vigila las métricas de cada servidor: uso de CPU, RAM y cantidad de conexiones activas [2:50]. Cuando detecta que los servidores están al límite, le avisa al servicio de autoescalamiento.

El autoescalamiento entonces crea nuevos servidores (C, D y E) basándose en una imagen del servidor A, lo que garantiza que todos tengan los mismos componentes y configuración [3:20]. Esos diez mil usuarios se distribuyen entre los cinco servidores gracias al balanceador.

¿Qué es el escalamiento horizontal?

Cuando se crean servidores adicionales a partir de una imagen base, se produce lo que se conoce como escalamiento horizontal [3:35]. No se hace más grande un solo servidor, sino que se aumenta la cantidad de servidores idénticos para repartir la carga. Este tipo de escalamiento es fundamental en arquitecturas cloud modernas.

Cuando el Black Friday termina y los usuarios bajan a cien, el autoescalamiento detecta que los servidores adicionales ya no tienen consumo significativo y los elimina automáticamente [3:55].

¿Qué son la capacidad mínima, deseada y máxima?

Para configurar correctamente el autoescalamiento necesitas definir tres parámetros esenciales [4:20]:

Capacidad mínima: el número más bajo de servidores que siempre van a estar activos. En el peor escenario, siempre tendrás al menos esta cantidad funcionando.
Capacidad máxima: el límite superior de servidores que el sistema puede crear. Si cinco servidores no alcanzan para un millón de usuarios y el máximo está en cinco, ya no escala más.
Capacidad deseada: la cantidad objetivo que el sistema intentará mantener en condiciones normales. Por ejemplo, tres servidores distribuidos uno en cada zona de disponibilidad.

Estos tres valores son configuraciones que dependen del conocimiento que tengas de tu aplicación [4:50]. No existe un número mágico universal; cada proyecto requiere analizar sus patrones de tráfico para definirlos correctamente.

El autoescalamiento fluctúa constantemente entre la capacidad mínima y la máxima, buscando siempre acercarse a la deseada. Esta combinación con servicios como EC2, balanceo de carga y CloudWatch crea una infraestructura robusta y eficiente.

Si quieres poner en práctica todos estos conceptos, incluyendo balanceo de carga y configuración de servidores, el siguiente paso es llevarlos a un laboratorio práctico donde puedas experimentar de primera mano cómo interactúan estos servicios.

Comentarios

Sebastián Arcila Sánchez

student•

Escalamiento Automático

Piensa que tienes tu aplicación de e-commerce y se aproxima el black friday. Vas a tener mucha demanda de usuarios. Nosotros, para vender más, debemos soportar dicha demanda. Para soportarla debemos crecer, y aquí es donde viene el autoescalamiento.

En la nube podemos crecer los servidores de forma rápida: podemos agregar o eliminar servidores según la demanda.
Permite mantener capacidad óptima de acuerdo a la demanda.

Escalamiento horizontal: Los servidores nuevos nacen a partir de una imagen de un servidor ya existente.

Capacidad mínima: Lo mínimo en lo que se puede mantener nuestra aplicación.

Capacidad máxima: Lo máximo a lo que puede autoescalar nuestra aplicación.

Capacidad deseada: La capacidad que deseo tener.

Miguel Figueroa

student•

Importante configurar estos tres parámetros al momento de definir el autoescalamiento:

Capacidad mínima: número mínimo de instancias a utilizar.
Capacidad deseada: número ideal de instancias activas.
Capacidad máxima: número límite de instancias al cual se puede escalar.

Marco Antonio Candia Ortega

student•

Resumen sobre Autoescalamiento en la Nube

El autoescalamiento ajusta automáticamente los recursos informáticos según la demanda, optimizando costos y eficiencia. En AWS, esto se gestiona con EC2 Auto Scaling.

🔹 ¿Cómo ayuda en eventos de alta demanda?

✔ Aumenta servidores cuando el tráfico crece (ej. Black Friday). ✔ Distribuye la carga de trabajo automáticamente. ✔ Reduce costos al eliminar servidores cuando la demanda baja.

🔹 ¿Cómo funciona?

1️⃣ Monitoreo con CloudWatch (CPU, RAM, usuarios activos). 2️⃣ Activación del escalamiento si los límites son alcanzados. 3️⃣ Expansión automática agregando más servidores. 4️⃣ Reducción automática eliminando servidores innecesarios.

📌 Ejemplo: Si inicias con 2 servidores, pero el tráfico crece, el sistema escala hasta 5 y luego baja nuevamente.

Cristofer Vargas Morales

student•

La capacidad mínima y máxima de servidores del servicio EC2 Auto Scaling se establece por grupo de Auto Scaling, que puede estar configurado para una zona de disponibilidad específica o distribuirse a través de varias zonas en una región. Esto permite escalar horizontalmente según la demanda, manteniendo la alta disponibilidad. Por lo tanto, la configuración se aplica a nivel de grupo de Auto Scaling, no a nivel de cuenta de AWS o región en general.

Gerardo Alberto Soto Alvarez del Castillo

student•

No copmprendí bien cuál es la diferencia entre capacidad mínima y capacidad Deseada, el sistema en la nube puede estar en la capacidad mínima si no hay recursos disponibles en la nube o porque?

Mario Alexander Vargas Celis

student•

🚀 Escalamiento Automático en AWS (Auto Scaling)

El escalamiento automático en AWS permite ajustar dinámicamente la cantidad de recursos (como instancias EC2 o tareas en ECS) según la demanda. Esto ayuda a optimizar costos y mejorar la disponibilidad de aplicaciones.

1️⃣ Tipos de Auto Scaling en AWS

AWS ofrece escalamiento automático para diferentes servicios:

Tipo de Auto ScalingServicio AWSEC2 Auto ScalingInstancias EC2ECS Auto ScalingContenedores en AWS ECSDynamoDB Auto ScalingBases de datos en DynamoDBAurora Auto ScalingClústeres de Amazon AuroraLambda Auto ScalingAWS Lambda escala automáticamente

2️⃣ Escalamiento Automático en EC2

EC2 Auto Scaling ajusta el número de instancias según la demanda.

🔹 Pasos para configurar Auto Scaling en EC2

1️⃣ Crear un Launch Template o Launch Configuration

Define la imagen AMI, tipo de instancia y configuraciones.

2️⃣ Crear un Auto Scaling Group (ASG)

Especifica la cantidad mínima, deseada y máxima de instancias.

3️⃣ Configurar Políticas de Escalamiento

Basadas en métricas como CPU, tráfico de red o latencia.

🔹 Comando AWS CLI para crear un Auto Scaling Group

aws autoscaling create-auto-scaling-group --auto-scaling-group-name MiASG \ --launch-template LaunchTemplateName=MiTemplate \ --min-size 1 --max-size 5 --desired-capacity 2 \ --availability-zones us-east-1a us-east-1b \ --health-check-type EC2 --health-check-grace-period 300

3️⃣ Escalamiento Automático en Contenedores (ECS)

En AWS ECS, las tareas pueden escalar automáticamente con Application Auto Scaling.

🔹 Comando AWS CLI para habilitar Auto Scaling en ECS

aws application-autoscaling register-scalable-target \ --service-namespace ecs \ --scalable-dimension ecs:service:DesiredCount \ --resource-id service/default/MiServicio \ --min-capacity 1 \ --max-capacity 10

4️⃣ Tipos de Estrategias de Auto Scaling

EstrategiaDescripciónEscalamiento ReactivoAjusta recursos cuando se superan umbrales (ej. CPU > 80%).Escalamiento PredictivoUsa Machine Learning para predecir demanda.Escalamiento ProgramadoCambia la capacidad en horarios específicos.

5️⃣ Beneficios del Auto Scaling

✅ Reduce costos al evitar servidores inactivos. ✅ Mejora la disponibilidad y tolerancia a fallos. ✅ Responde automáticamente a cambios en la demanda.

Miguel Angel Reyes Moreno

student•

¿El escalamiento siempre es horizontal o puedo ajustar si deseo que sea vertical también?

Platzi

student•

El escalamiento que se aborda en la transcripción es horizontal. No se menciona la posibilidad de ajustar a escalamiento vertical en el texto proporcionado.

Max Andy Diaz Neyra

student•

Tambien existe el escalamiento vertical en concepto. Pero el EC2 autoescaling trabaja con escalamiento horizontal.

Autoescalamiento en AWS: Gestión Dinámica de Recursos en la Nube

Fundamentos de la Infraestructura Global de AWS

Conceptos Fundamentales de AWS y la Nube

Registro y uso de la consola de AWS para servicios en la nube

Seguridad en AWS: Prácticas Esenciales y Gestión de Accesos

Modelo de Responsabilidad Compartida en AWS: Seguridad y Cumplimiento

Creación y gestión de usuarios en AWS IAM

Regiones y Zonas de Disponibilidad en AWS

Infraestructura Global de AWS: Local Zones, Outposts y Edge Locations

Gestión de DNS y dominios con AWS Route 53

Redes en AWS

Componentes y configuración de una VPC en AWS

Seguridad en VPC: Grupos de Seguridad y Network ACLs

Creación de una VPC en AWS: Paso a Paso Práctico

Creación de VPC en AWS: Internet Gateway y NAT Gateway

Opciones de Conectividad en AWS: VPN y DirectConnect

Servicios Perimetrales en AWS: CloudFront y Global Accelerator

Servicios de cómputo en AWS

Fundamentos de Amazon EC2: Servidores Virtuales en la Nube

Creación de un Servidor Web en AWS Paso a Paso

Conexión a Servidor AWS EC2 usando SSH en Mac y Linux

Conexión a Servidor con PuTTY en Windows

Instalación de un Servidor Web Apache en AWS EC2

Tipos de Instancias EC2 y Casos de Uso en AWS

Comparación de precios y tipos de instancias EC2 en AWS

Servicios de Contenedores en AWS: Docker, ECS, EKS y Fargate

Conceptos Básicos de Serverless y AWS Lambda

Balanceo de Carga y Auto escalamiento

Balanceo de Carga en AWS: Tipos y Usos Prácticos