Escalabilidad vertical vs horizontal en la nube

Curso de Introducción a la Nube

Contenido del curso

No sé dónde empezar

Introducción al curso

Cómo entender la nube

Introducción a Cloud Computing / Nube

Conceptos de Cloud Computing / Nube

Multi-Nube

Modelos de servicio en Cloud Computing / Nube

20
IaaS, PaaS y SaaS explicados con pizza
06:29 min

Características de una arquitectura en Cloud Computing /Nube

Construyendo nuestra arquitectura

Tomar examen

Escalabilidad vertical vs horizontal en la nube

Resumen

La escalabilidad en la nube es la capacidad de aumentar o disminuir recursos según la demanda de tu aplicación. Si manejas un servicio como Platzi Wallet y se viene Black Friday, necesitas que tu infraestructura crezca para soportar millones de transacciones y luego vuelva a su tamaño original cuando pase el pico. Aquí te explico cómo funciona y por qué importa para construir aplicaciones resilientes.

¿Por qué la escalabilidad es clave en aplicaciones cloud?

Piensa en Platzi Wallet lanzando una promoción de mes de las madres con 10% de descuento. Las transacciones se disparan. Si tu aplicación no escala, se cae justo en el momento de mayor movimiento de dinero. Y eso, simplemente, no puede pasar.

La escalabilidad te permite responder a esos picos sin sacrificar la experiencia del usuario. Pero también funciona al revés: cuando termina Black Friday, los recursos deben decrecer porque en la nube pagas por uso. Dejar servidores prendidos sin necesidad va en contra de todos los principios cloud.

¿Qué es la escalabilidad en cloud computing? Es la capacidad de incrementar o decrementar los recursos de tu infraestructura para cumplir con la demanda del servicio en cada momento.

¿Cómo se ve la escalabilidad con un ejemplo real?

Imagina Platzi Wallet distribuida en dos zonas de disponibilidad, con un balanceador de aplicaciones y dos microservicios de pagos en cada zona [01:30]. Cuando un usuario hace una petición, el balanceador la dirige a uno de los servicios disponibles.

Ahora llega Black Friday y aparecen 100.000, un millón, 10 millones de usuarios comprando. Esos cuatro microservicios no aguantan. Lo ideal es que los servicios crezcan rápidamente, soporten la carga y, al pasar el pico, vuelvan a su estado original.

¿Cuáles son los tipos de escalabilidad en la nube?

Existen dos formas de escalar tu infraestructura, y cada una tiene implicaciones muy distintas en cuanto a tiempo, costo y disponibilidad del servicio.

¿Qué es la escalabilidad vertical y cuándo evitarla?

La escalabilidad vertical es la capacidad de añadir más recursos al mismo nodo para que crezca y soporte una demanda mayor [03:30]. En la práctica, tomas tu servidor con Platzi Wallet, lo apagas, le aumentas CPU, RAM y disco, y lo vuelves a prender.

Aquí pasan tres cosas que debes tener claras:

La cantidad de servidores no cambia, sigue siendo el mismo nodo.
Hay caída del servicio porque tienes que apagarlo para modificarlo.
Cuando termina el pico, repites el proceso para reducir tamaño y vuelve a haber downtime.

Por eso conviene evitarla al máximo: siempre hay caída del servicio.

¿Qué es la escalabilidad horizontal y por qué es la favorita?

La escalabilidad horizontal es la capacidad de agregar más nodos para soportar una demanda creciente [04:50]. En lugar de hacer un servidor más grande, replicas microservicios o servidores adicionales que comparten la carga.

¿Cuál es la diferencia entre escalabilidad horizontal y vertical? La vertical agrega recursos al mismo servidor y genera downtime. La horizontal agrega más servidores o nodos sin caída del servicio y permite crecer y decrecer de forma casi inmediata.

Las ventajas son claras:

No hay downtime al escalar hacia arriba.
Tampoco hay downtime al decrecer cuando pasa la demanda.
El crecimiento es prácticamente inmediato cuando trabajas con microservicios.

Si escalas con servidores completos en lugar de microservicios, el crecimiento es un poco más lento, pero sigue siendo horizontal y sin interrupciones.

¿Sirve la escalabilidad sin alta disponibilidad?

Aquí está el detalle que muchos pasan por alto. Puedes diseñar una aplicación muy escalable, pero si solo escalas dentro de una sola zona de disponibilidad, pierdes alta disponibilidad. Si esa zona falla, todo cae sin importar cuántos nodos tengas replicados.

Por eso en los diagramas la escalabilidad siempre aparece distribuida en más de una zona. Escalabilidad y alta disponibilidad son conceptos que se complementan, no se reemplazan.

¿Por qué la escalabilidad debe combinarse con alta disponibilidad? Porque escalar en una sola zona no protege ante fallos regionales. Distribuir nodos en varias zonas asegura que tu aplicación siga operando aunque una zona falle.

¿Cómo diseñar una aplicación escalable en todas sus capas?

La meta es que tu arquitectura ajuste su capacidad de forma automática, crezca o decrezca según la demanda real y esté distribuida para resistir fallos. Eso te permite construir aplicaciones resilientes a los cambios de tráfico y al comportamiento impredecible de los usuarios.

Cuéntame en los comentarios cómo aplicarías escalabilidad horizontal en un proyecto que estés trabajando.

Mario Alexander Vargas Celis

Estudiante

📈 Escalabilidad Horizontal vs. Escalabilidad Vertical

La escalabilidad es la capacidad de un sistema para aumentar su rendimiento a medida que crece la demanda. Existen dos enfoques principales:

1️⃣ Escalabilidad Vertical (Scale-Up)

🔹 ¿Qué es? Aumentar la capacidad de un solo servidor (más CPU, RAM, almacenamiento, etc.). 🔹 Cómo se logra: ✔️ Mejorar el hardware (procesador más potente, más memoria, discos más rápidos). ✔️ Migrar a una máquina más poderosa (ejemplo: cambiar de un servidor de 16GB RAM a uno de 64GB).

✅ Ventajas: ✔️ Simplicidad: Menos cambios en la arquitectura. ✔️ Puede ser más eficiente para aplicaciones monolíticas.

❌ Desventajas: ❌ Límite físico: No se puede escalar indefinidamente. ❌ Punto único de falla: Si el servidor falla, todo el sistema cae. ❌ Costoso: Máquinas más potentes son más caras.

📌 Ejemplo en la nube:

Aumentar el tamaño de una instancia EC2 en AWS (pasar de t2.micro a t3.large).
Cambiar una base de datos de Google Cloud SQL a un tamaño mayor.

2️⃣ Escalabilidad Horizontal (Scale-Out)

🔹 ¿Qué es? Añadir más servidores para distribuir la carga de trabajo. 🔹 Cómo se logra: ✔️ Agregar más instancias y distribuir la carga con un balanceador de carga. ✔️ Descomponer una aplicación monolítica en microservicios para escalar partes específicas.

✅ Ventajas: ✔️ Alta disponibilidad: Si un nodo falla, los demás siguen funcionando. ✔️ Escalabilidad infinita: Se pueden agregar más servidores según sea necesario. ✔️ Eficiencia de costos: Mejor aprovechamiento de recursos.

❌ Desventajas: ❌ Mayor complejidad: Requiere arquitecturas distribuidas y balanceadores de carga. ❌ Latencia: La comunicación entre servidores puede afectar el rendimiento.

📌 Ejemplo en la nube:

AWS Auto Scaling: Se agregan instancias EC2 cuando aumenta la demanda.
Google Kubernetes Engine (GKE): Escalar contenedores automáticamente.
Base de datos distribuida como Google Spanner o Amazon DynamoDB.

📊 Comparación:

CaracterísticaEscalabilidad VerticalEscalabilidad HorizontalMétodoMejorar el hardware del servidorAgregar más servidoresLímite de crecimientoLimitado por la máquinaEscalabilidad casi infinitaCostoAlto (máquinas potentes son caras)Mejor optimización de costosDisponibilidadPunto único de fallaMayor disponibilidadComplejidadBajaAlta (requiere balanceo de carga y distribución de datos)EjemploAumentar RAM de un servidorAgregar más servidores con balanceador de carga

🚀 ¿Cuál elegir?

✔ Escalabilidad Vertical → Si el crecimiento es moderado y la arquitectura es monolítica. ✔ Escalabilidad Horizontal → Si necesitas alta disponibilidad, distribución de carga y crecimiento continuo.

Gabriel Obregón

Diego Fernando Ramos Aguirre

Javier Cómbita Téllez

Patricio Sánchez Fernández

Rodrigo E Toobe

Víctor Hugo Suárez Quiroz

Maria Camila Amaya Rubio

Jorge Rodriguez

Carlos Andrés Zambrano Barrera

Profesor

Lucas Rojas

Jhon Freddy Tavera Blandon

Jose Alejandro Pantoja Giraldo

Julian Mauricio Perez Mora

Angel Rosendo Condori Coaquira

Ricardo Collado

Eric Fabian Hernández Garnica

Anderson Perez

ANDRES ALFONSO MIRA MEJIA

Carlos Emmanuel Cobian Soria

Mateo Montoya Henao

Alfredo Olmedo

Holger Farias

Mauricio Ruiz Rubio

Escalabilidad vertical vs horizontal en la nube

Introducción al curso

5 razones para usar la nube ahora

Aplicación de Billetera Virtual: Conceptos y Funcionalidades Básicas

Cómo entender la nube

Servidores y almacenamiento en la nube

Tipos de bases de datos en la nube

Microservicios, funciones y contenedores en la nube

On-premises vs nube: qué cambia al escalar

Introducción a Cloud Computing / Nube

Qué es cloud computing y cómo se cobra

Ventajas reales de migrar a la nube

Qué cambia al migrar una app a la nube

Infraestructura Global en la Nube: Regiones y Zonas de Disponibilidad

Nube privada, pública, híbrida y multinube

Conceptos de Cloud Computing / Nube

Qué es cloud native y por qué importa

Arquitectura cloud native de una app real

Ventajas y retos del modelo serverless

Componentes clave de una arquitectura serverless

Arquitectura serverless con API y funciones

Principales Proveedores de Servicios Cloud y Sus Ventajas

Multi-Nube

Tipos de lock-in en arquitectura cloud

Estrategias multinube para elegir tu proveedor

Modelos de servicio en Cloud Computing / Nube

IaaS, PaaS y SaaS explicados con pizza

Características de una arquitectura en Cloud Computing /Nube

Alta disponibilidad vs tolerancia a fallos en la nube