Escalamiento Vertical vs Horizontal: Cuándo y Cómo Usarlos

Clase 3 de 17 • Audiocurso de Fundamentos de Arquitectura de Alta Concurrencia

Contenido del curso

Introducción a alta concurrencia

Escalabilidad

Herramientas

Seguridad

13
Cómo manejar ataques DDOS en alta concurrencia
02:37 min

Protocolos

14
gRPC o REST en alta concurrencia
02:43 min

Negocios y casos de uso

Conclusiones

17
Conclusiones
02:07 min

Tomar examen

Resumen

¿Qué es la escalabilidad en aplicaciones y microservicios?

Entrar en el mundo de la escalabilidad en aplicaciones y microservicios es esencial para garantizar que estos sistemas sean eficientes y económicos. La escalabilidad es la capacidad de un sistema para manejar una cantidad creciente de trabajo añadiendo recursos. Existen dos tipos principales de escalamiento: vertical y horizontal. ¿Quieres saber cuál es el más adecuado para tu aplicación? Sigue leyendo.

¿En qué consiste el escalamiento vertical?

El escalamiento vertical se refiere a incrementar el tamaño de una instancia de servidor. Imagina que tienes un servidor con 4 GB de RAM y 2 CPUs que no puede manejar todo el tráfico entrante. Podrías ampliar este servidor a 16, 32 o incluso 64 GB de RAM y añadir más CPUs. Este tipo de escalamiento es útil cuando necesitas procesar tareas intensivas en CPU, como el procesamiento de vídeos, donde un único servidor debe gestionar la tarea completa.

Sin embargo, el escalamiento vertical tiene sus limitaciones. Solo puedes aumentar el tamaño del servidor hasta cierto punto antes de que sea económicamente inviable. Además, si el servidor falla, toda la aplicación puede verse afectada.

¿Qué implica el escalamiento horizontal?

A diferencia del escalamiento vertical, el escalamiento horizontal significa agregar más instancias de servidor para distribuir la carga. Esto es ideal cuando tienes muchas peticiones pequeñas y quieres que diferentes partes de tu aplicación puedan crecer de manera independiente, optimizando recursos y costos.

Por ejemplo, en un sistema de autenticación o cuando se sirven archivos pequeños, puedes optar por añadir más servidores en lugar de hacerlos más grandes, lo que permite recibir más peticiones simultáneamente.

El escalamiento horizontal ofrece flexibilidad para gestionar la carga de tráfico, ya que puedes especializar cada servidor para tareas específicas: GPU para tareas gráficas intensivas, más CPU para procesamiento de datos, o servidores con más RAM para caché.

¿Cuándo elegir entre escalamiento vertical u horizontal?

La elección entre escalamiento vertical y horizontal depende del caso de uso y los requisitos específicos de la aplicación:

Procesamiento intensivo de tareas: Opta por el escalamiento vertical cuando necesitas que un solo servidor gestione tareas pesadas, como procesamiento de vídeos.
Alta concurrencia de peticiones pequeñas: Es recomendable el escalamiento horizontal para poder distribuir la carga eficientemente entre múltiples servidores.

Atrévete a explorar y experimentar con diferentes enfoques de escalamiento para encontrar la mejor solución para tu aplicación. Y como siempre, la práctica hace al maestro: te invito a que pienses en ejemplos adicionales de cuándo usar cada tipo de escalamiento y los compartas, lo que enriquecerá tu comprensión y experiencia en este campo apasionante. ¡Sigue aprendiendo y motivándote en este camino del desarrollo escalable!

Comentarios

Omar D

student•

AUTOSCALING ANIDADO

Es un poco complejo implementar el escalado, ya que en mi caso requerí de mucha información y parametrización para poder implementar lo que le llamamos escalado horizontal anidado.

Teníamos una aplicación corriendo en Kubernetes y que tenía mínimo 1 pod y máximo 3 corriendo. Todo bien, después con el tiempo nos dimos cuenta de que la usabilidad de la aplicación iba creciendo exponencialmente y al no estar preparados la aplicación comenzó a experimentar fallos (a pesar de usar kubernetes en AWS).

Que decidimos hacer?

medimos las horas pico de usabilidad
medimos la cantidad de recursos que se utilizan en esas horas
con base a ello se parametrizó de manera más eficiente la cantidad de pods que se utilizarán y los disparadores que crearán estos pods.

Pero la legión del mal atacó nuevamente. Sin embargo esta vez el servidor que servía como worker node estaba saturado por lo que teníamos que tomar una decisión: ¿Le incrementamos en recursos? Sabíamos que incrementar en recursos no era muy eficiente, puesto que solo se utilizaría en cierta cantidad de tiempo. Por otro lado el hecho de incrementarle recursos implicaba apagar la máquina virtual así como tratar de parametrizar la hora más eficiente para subir los recursos

¿Qué decidimos hacer??

volver a medir, medir y medir.
separamos el plano de datos (media) que vivían en el servidor (worker node) y lo implementamos via EFS con el fin de evitar inconsistencias de datos.
implementamos crecimiento horizontal de los worker nodes con el uso de autoscaling groups.
voila (como dicen en España ese servicio no lo tumba ni Dios)

Alexis Dorado Muñoz

student•

¡Gran historia! Me encantó la narrativa y cómo superaron el desafío del escalado. Usar EFS y autoscaling groups fue la clave. ¡Felicitaciones por la solución "a prueba de la legión del mal"!

Mariano Italiano

student•

Escalamiento vertical: Aumentar la potencia de servidor Escalamiento horizontal: Aumenta el numero de servidores

Alexis Dorado Muñoz

student•

Gracias por tu aporte

José Sánchez

student•

Un ejemplo de DB:

MySQL (escalamiento vertical)
MongoDB (escalamiento horizontal)

Jairo Andres Grajales Salinas

student•

No entiendo tu comentario

Angel Afonso

student•

Las bases de datos relacionales naturalemte es un tanto complicado escalarlas horizontalmente, no es imposible pero si es complicado, por eso es preferible escalarlas verticalmente. En cambio las bases de datos no relacionales son mucho mas sencillas de escalar horizontalmente

Sebastián Ospino

student•

Tipos de escalamiento: vertical y horizontal

Escalamiento vertical
- Consiste en aumentar los recursos computacionales de un servidor o máquina (ya sea virtual o no). Por ejemplo, incrementar la memoria RAM de 16GiB a 32GiB, de esta manera disminuyen los fallos de paginamiento del sistema operativo, lo que incrementa la velocidad de ejecución de los procesos
- Este tipo de escalamiento es útil en el procesamiento de video, puesto que el servidor o máquina en cuestión tiene que ser capaz de ejecutar todos los procesos necesarios para procesar el video en un tiempo aceptable para el negocio y sin fallas
Escalamiento horizontal
- Consiste en crear más servidores, es decir, réplicas
- Este tipo de escalamiento es útil cuando se quiere poder atender un mayor número de peticiones concurrentes en una misma ventana de tiempo. Por ejemplo, si se quiere pasar de cien mil autenticaciones exitosas concurrentes cada segundo a ciento cincuenta mil cada segundo, sería buena idea agregar réplicas de los componentes de autenticación de usuarios
Ambos tipos de escalamiento se pueden combinar
Existen varios tipos de servidores
- Especializados en GPU, para procesamiento gráfico
- Especializados en CPU, para procesos normales
- Especializados en más memoria RAM, pueden ser útiles para caché

Gonzalo Amador Hernández

student•

Escala verticalmente cuando las tareas que se realizaran sean pesdas y horizontalmente cuando las tereas sean muy concurrentes. ahora si la tarea es pesda y muy concurrente, reviza tu app y sino se puede hacer mas, escala de ambas formas, pero para no gastar demaciodos recursos, escala solamente en las hroas pico cuando tu app este mas saturada.

Juan David Cajamarca Acuña

student•

¿Cómo se sabe que una aplicación o microservicio necesita escalamiento vertical u horizontal?

El escalamiento vertical es simplemente agrandar el tamaño de las instancias.
El escalamiento horizontal se da cuando en vez de agrandar los servidores, se crean más servidores.

Un tipo de escalamiento no es mejor que otro, se debe implementar uno u otro dependiendo de las necesidades.

¿Existe algún caso de uso donde se prefiera un escalamiento vertical a horizontal al momento de atender problemas de alta concurrencia? En el caso de que tengamos muchas peticiones cortas, no necesitamos un escalamiento vertical, sino uno horizontal. Esto nos permitirá recibir más peticiones y escalar independientemente; las diferentes partes de nuestra aplicación pueden crecer sin necesidad de estar involucradas en otras.

Continuando con el ejemplo de la clase anterior, podríamos escalar verticalmente los recursos encargados del procesamiento de videos y escalar horizontalmente los recursos encargados de la autenticación de usuarios (se pueden implementar los dos tipos de escalamientos en una misma infraestructura a diferentes recursos). De esta forma seremos más eficientes a la hora de usar recursos. Y esto no solamente nos permitirá ahorrar dinero, sino que podemos elegir recursos que sean mejores en unas cosas que en otras; por ejemplo, en algunos proveedores de nube hay algunas instancias de servidores que especiales para GPU (tienen un procesador de gráficas mucho mejor que el de los servidores comunes), otras especiales en CPU (tienen más procesamiento) u otras con más memoria RAM (pueden ser usadas por ejemplo para caché).

Debemos siempre tener en cuenta que tenemos diferentes tipos de recursos y diferentes formas de escalar que pueden ser aplicadas de diferentes maneras dependiendo del uso de nuestra aplicación.

HECTOR FABIO JIMENEZ SALDARRIAGA

student•

Excelente aporte, solo corregiría la parte que dice que se debe implementar uno u otro, adicionaría que la escalabilidad también puede ser una combinación de ambas opciones y también debemos recordar que el cloud computing t una de sus características es la elasticidad

Rodmy Suarez

student•

Algo que manejamos en el equipo al que pertenezco:

Comprender el objetivo de los servicios que manejamos en nuestros servidores.
Tener una medición de la cantidad de solicitudes que se atienden, asi como el consumo de los recursos

En base a la información debemos definir una metrica con respecto al performance (por lo general entiendo es tipo de respuesta del servicio, para casos sincronos), definiendo el margen aceptable para el redimiento de nuestros servicios por ejemplo que el tiempo de respuesta sea de (.5 a 1 segundo).

Con este Margen:

Si no llegamos a los tiempos de los servicios debido a que no tenemos recursos, se debe pensar en escalar verticalmente. Generalmente existen parametros dependiendo de la tecnología, por ejemplo hasta cuanta memoria se puede asignar a una JVM, etc.
Si notamos que en base a la cantidad de requerimientos procesados el performance se ve impactado, se debe pensar en escalar horizontalmente.

Joziel Canda

student•

En un sistema que gestiona documentos escaneados, los cuales son subidos a un repositorio central agregando meta data asociada al archivo. ¿Cuál sería la mejor practica para escalar los repositorios de archivos?

Pablo Fredrikson

teacher•

En esos casos siempre te conviene usar un storage ilimitado (object storage) como S3 en amazon.

Armando Suarez

student•

Yo una vez discuti con mi lider de área porque tengo un ambiente Web balanceado mediante un BIGIPF5 y solicité un par de servidores más de los que ya tenía para resolver solicitudes, y él me comentaba que porque no esclarlo de forma Vertical, para mi fue difícil decirle que lo que sufríamos no era de procesamiento si no de disponiblidad con los servicios que se saturaban con tareas y requeriamos de dejar servidores libres por lo tanto sugería escalar de forma horizontal, fue un kaos después de varias sesiones, diagramas y explicar el flujos de las apps por fin cedió en fin, es un tema difícil escoger una u otra porque los escenarios pueden ser muy diferentes.

Ederson García Acevedo

student•

amigo, osea la escalabilidad vertical se tiene en cuenta cuando estamos bajos de recursos para que el servidor ejecute tareas?

Ivan Ramos Sánchez

student•

Un ejemplo de escalamiento Horizontal: Tenemos un microservicio que procesa transacciones a nivel nacional, un día dejó de operar por un problema de red en domingo al medio día, nadie se dio cuenta hasta el domingo a media noche, cuando entramos a revisar para echarlo a andar de nuevo, ya tenía 120k transacciones atoradas y más llegando, afortunadamente estaba en docker y k8s, se modificó el deploy para que las replicas fueran 3, y se escaló también el número de mensajes que podían consumir, como el número de instancias hacía match con sus indices cada instancia procesó sus propios mensajes sin afectar a los demás. La velocidad de procesamiento se incrementó x10 +- un proceso que podría haber durado unas 6 horas en atender transacciones atoradas terminó en 40 minutos. Un ejemplo de escalamiento Vertical: Una aplicación web de reportería tardaba como 20 mi en generar 1 sólo reporte, que aunque la conexión y consultas a BD eran optimas, internamente la aplicación hacia muchos cálculos, transformaciones y complementos de datos, La opción fue darle más poder de procesamiento al server y el tiempo bajó a 2 minutos.

Kevin Costa

student•

Escalamiento horizontal en caso de ataques ddos o campañas de marketing

Eleana Magdalena Hurtado Babilonia

student•

Tipos de escalamiento -Vertical: Agrandar el tamaño de la instancia -Horizontal: Creamos más servidores

Peter Cerpa López

student•

Un Caso de Escalamiento es vertical puede ser para servidores de monitoreo, por lo cual se enfocan siempre en el procesamiento para realizar sus operaciones.

Daniel Eduardo Rojas Pulido

student•

La gran pregunta que siempre me hago

Alexis Dorado Muñoz

student•

El reto: Implementar un escalado horizontal "anidado" en una aplicación Kubernetes que experimentaba fallos por el aumento en la demanda.

Primer intento: Ajustar el número de pods y sus disparadores basándonos en las horas pico y el consumo de recursos.

Nuevo problema: Saturación del worker node. Aumentar sus recursos era una solución temporal y poco eficiente.

Solución final:

Separar el plano de datos y usar EFS para evitar inconsistencias.
Implementar escalado horizontal de los worker nodes con autoscaling groups.

Conclusión: Conseguimos un sistema mucho más robusto y escalable, capaz de manejar picos de demanda sin problemas.

JUAN PABLO BOLIVAR MARTINEZ

student•

Si al momento de procesar los mensaje de una cola, dichos mensajes se están acumulando quiere decir que la tasa de procesamiento es inferior a la tasa de recepción, en ese caso lo idea seria un escalamiento horizontal para brindar la capacidad de procesar mas mensajes a la vez, lo que mejoraría la tasa la procesamiento.

Irving Juárez

student•

Ojo, porque suena muy bonito decir: Escalamos de manera horizontal o vertical dependiendo del caso de uso.

Pero aqui la verdadera pregunta seria, como se cuando hay que escalar un servicio? Bueno, con el monitorio de nuestros recursos nosotros podemos registrar ciertos thresholds o limites para que una vez esos limites se hayan superado, empecemos a escalar nuestros servers, containers, etc

Martin Oscar Martinez Gutierrez

student•

Un escalamiento vertical en un cluster de servidores (ej Hypervisores) sería ampliar la capacidad de mis nodos en RAM y Procesador de cada uno de ellos y el vertical claramente agregar mas nodos a mi cluster. Con una SAN vertical sería crecer en discos en mi cajon o mejorar los discos a All Flash, y horizontal sería agregar otra SAN a mi red.

Edwin Castelblanco Sánchez

student•

El escalado vertical (o "escalamiento hacia arriba") es un enfoque utilizado para aumentar el rendimiento de un sistema al agregar más recursos a una sola máquina o servidor. Esto se logra mediante la adición de más CPU, RAM, almacenamiento u otros recursos al servidor existente.

Juan Manuel Hincapié

student•

Escalamiento vertical

Agrandar el tamaño de la instancia por mayor demanda

En lugar de tener 4 GB de RAM escalar el servidor a 32GB por ejemplo

Escalamiento horizontal

Creamos más servidores

En lugar de tener 1 tener 2 o más

Casos de uso

Muchas peticiones

Cuando tengo muchas peticiones a mi servidor no se solucionarán con un escalado vertical ya que el servidor ya está saturado por lo que en un caso como esos es recomendable aumentar la cantidad de servidores

Nota: Los servicios se pueden escalar de manera independiente

Escalamiento Vertical vs Horizontal: Cuándo y Cómo Usarlos

Introducción a alta concurrencia

Sistemas de Arquitectura de Alta Concurrencia y DevOps

Fundamentos de Arquitectura de Alta Concurrencia

Escalabilidad