Arquitectura de Servidores para Escalabilidad y Alta Disponibilidad

Clase 24 de 27 • Curso de Introducción a la Nube

Contenido del curso

Introducción al curso

Cómo entender la nube

Introducción a Cloud Computing / Nube

Conceptos de Cloud Computing / Nube

Multi-Nube

Resumen

Diseñar una arquitectura backend que corra completamente en servidores exige responder preguntas fundamentales: ¿cómo escalar cuando la demanda crece?, ¿cómo garantizar que la aplicación nunca deje de funcionar? y ¿qué métricas usar para crecer o reducir recursos de forma automática. A continuación se desglosan los elementos clave de esta arquitectura tomando como caso práctico la aplicación Platzy Wallet.

¿Cómo se estructura la arquitectura desde el usuario hasta el servidor?

Todo parte del usuario [0:22]. La arquitectura debe pensarse siempre desde quien va a consumir la aplicación. A partir de ahí se construyen las capas en orden:

DNS: el punto de entrada, en este caso platzywallet.com, que resuelve la dirección del servicio [1:00].
CDN más WAF: una capa combinada que acelera la entrega de contenido estático y protege contra ataques a nivel de red [1:12].
API Gateway con autenticación y autorización: capa intermedia que valida quién puede acceder a los recursos del backend [1:30].
Balanceador de aplicaciones: opera en la capa 7 del modelo OSI, es decir, trabaja con tráfico HTTPS. Su función es distribuir las peticiones entre los servidores disponibles usando un algoritmo como round-robin, que alterna las solicitudes entre el servidor de la zona de disponibilidad 1 y el de la zona 2 de forma secuencial [1:22].

¿Por qué distribuir servidores en zonas de disponibilidad?

Las zonas de disponibilidad (Availability Zones o AZ) son ubicaciones físicamente separadas dentro de una región de nube [2:08]. Colocar servidores en al menos dos zonas distintas garantiza alta disponibilidad, algo que se describe como no negociable en cualquier arquitectura profesional [2:30]. Si una zona falla, la otra sigue atendiendo usuarios sin interrupción.

¿Qué es el autoescalamiento y cómo funciona en servidores?

Cuando la base de usuarios pasa de unos pocos a cien mil, dos servidores no son suficientes. Aquí entra el grupo de autoescalamiento (autoscaling group) [3:30], un componente disponible en todos los proveedores de nube que permite que la cantidad de servidores crezca o se reduzca automáticamente.

Este tipo de crecimiento es escalamiento horizontal [4:20]: se replican nodos idénticos sin necesidad de apagar la aplicación, es decir, sin downtime.

¿Qué parámetros definen el autoescalamiento?

Para configurar el grupo de autoescalamiento se establecen tres valores [4:40]:

Capacidad mínima: la cantidad más baja de servidores que la aplicación necesita para funcionar, por ejemplo, dos.
Capacidad deseada: normalmente coincide con la mínima, distribuyendo un servidor por cada zona de disponibilidad.
Capacidad máxima: el tope para evitar costos descontrolados, por ejemplo, ocho servidores. Esto es crucial ante un ataque de denegación de servicio que genere tráfico artificial masivo [5:10].

¿Sobre qué métricas se debe escalar?

Las reglas de autoescalamiento se definen mediante métricas de monitoreo [5:40]. Un ejemplo con CPU sería:

CPU mayor al 60 %: incrementar un servidor [6:05].
CPU mayor al 80 %: sumar dos servidores [6:20].
CPU inferior al 60 %: restar un servidor [6:35].
CPU inferior al 40 %: reducir en dos servidores, sin bajar nunca de la capacidad mínima [6:50].

Sin embargo, el consejo práctico es escalar sobre métricas de demanda en lugar de recursos técnicos como CPU o RAM [7:15]. Por ejemplo, si la cantidad de requests o usuarios concurrentes supera mil, se agrega un servidor; si supera cien mil, se agregan cuatro.

¿Qué ocurre cuando nace un nuevo servidor?

Cada servidor nuevo se crea a partir de una AMI (Amazon Machine Image), una imagen base que ya tiene todo el software preinstalado [7:55]. Esto permite replicar el entorno de forma consistente. No obstante, hay que considerar un tiempo de escalamiento de tres a cinco minutos [8:10] mientras se completan dos procesos:

La creación del servidor a partir de la imagen.
La verificación de salud por parte del balanceador antes de enviarle tráfico.

Además de la capa de servidores, la arquitectura completa incluye base de datos, almacenamiento, conexión híbrida, monitoreo, trazas, compliance y seguridad [8:30].

Si estás evaluando en qué tipo de infraestructura desplegar tu aplicación, entender estos tres ejes —autoescalamiento, distribución en zonas de disponibilidad y tiempo de respuesta ante picos— te dará criterios sólidos para tomar la mejor decisión. ¿Ya has trabajado con grupos de autoescalamiento en algún proveedor de nube? Comparte tu experiencia en los comentarios.

Comentarios

Gabriel Obregón

student•

¿Cómo sería nuestra arquitectura si la app corriera completamente basada en servidores? ++DIFERENCIAS (balanceador y backend)++:

Balanceador de aplicaciones: balanceamos tráfico HTTPS. Capa 7 del modelo. El algoritmos del balanceador va a ser un round robin (alterna una y otra zona).
AUTOESCALAMIENTO (autoscaling group): ante más demanda, basándonos en una imagen del servidor (AMI: Imagen base que ya tiene todo preinstalado), estos crecen en cantidad. Cada servidor nuevo tarda 3 minutos en crearse desde la AMI y hasta que el balanceador determina que está saludable para mandarle tráfico. La escalabilidad horizontal que no requiere downtime (que la app se caiga). Definir cantidad mínima de servidores para soportar la app, la cantidad deseada y la cantidad máxima. Debemos definir la cantidad máxima para no crecer indefinidamente y que se nos consuma todo el costo de un mes.
Métricas de monitoreo: para definir cuando comenzamos a crecer en servidores. Ejemplo: cuando la CPU > 60 % sume un servidor y cuando la CPU > 80% sume 2 servidores. También: cuando la CPU % < 60 % reduzca 1 servidor y cuando CPU < 40 % reste 2 servidores. Siempre y cuando no llegue a menos de la capacidad mínima.
Se puede escalar en cualquier parámetro (% CPU, RAM, etc) pero lo mejor es escalar sobre parámetros de demanda. Ejemplo: Cantidad de usuarios.
Tener en cuenta: como escalar, el tiempo de escalamiento y la alta disponibilidad.

Diego Fernando Ramos Aguirre

student•

Gracias por el aporte.

Patricio Sánchez Fernández

student•

Buen aporte, Gabriel.

Alex Henrry Naupay Ferrer

student•

José Luis Puc Sarmiento

student•

Johan Sebastian Cuellar

student•

Gracias por el aporte

Maria Camila Amaya Rubio

student•

Cosas a tener en cuenta al diseñar una arquitectura basada en servidores:

Autoescalamiento: ¿Cómo van a escalar mis servidores para soportar una demanda creciente de usuarios?
Alta disponibilidad: Al escalar, los servidores deben estar distribuidos en 2 o más AZ.
Tiempo de escalamiento y métricas: A partir de qué cantidad de recursos utilizados sumaremos o restaremos servidores.

STIVE ALEJANDRO GONZALEZ ALMANZA

student•

profe muchas gracias, tu explicas de una manera muy profesional, entiendo todo al 100%

Jhon Freddy Tavera Blandon

student•

Descripción General

Arquitectura de aplicación web desplegada en la nube, con alta disponibilidad, escalabilidad y seguridad.

Usuarios (100K):
- La aplicación está diseñada para manejar hasta 100,000 usuarios o mas segun el escalamiento.
DNS (platziwallet.com):
- El Sistema de Nombres de Dominio (DNS) redirige las solicitudes de los usuarios a la infraestructura de la aplicación.
CDN + WAF:
- CDN (Content Delivery Network): Distribuye el contenido de la aplicación de manera geográficamente distribuida para mejorar la velocidad de carga y reducir la latencia.
- WAF (Web Application Firewall): Protege la aplicación de ataques comunes como inyecciones SQL, cross-site scripting (XSS), etc.
API Gateway + Autenticación y Autoridad (AUTH):
- API Gateway: Administra las solicitudes entrantes, enruta las peticiones a los servicios apropiados y maneja tareas como autenticación, autorización, y gestión de tráfico.
- Autenticación y AUTH: Gestiona la autenticación de usuarios y la autorización para acceder a diferentes recursos de la aplicación.
Balanceador de Aplicaciones:
- Distribuye el tráfico entrante entre múltiples instancias de la aplicación para asegurar que ninguna instancia esté sobrecargada, mejorando la disponibilidad y el rendimiento.
Instancias de la Aplicación en Zonas de Disponibilidad (AZ-1 y AZ-2):
- La aplicación está desplegada en dos zonas de disponibilidad (AZ-1 y AZ-2) para asegurar alta disponibilidad y tolerancia a fallos.
- Cada zona de disponibilidad tiene varias instancias de servidores que ejecutan la aplicación.
Base de Datos + Almacenamiento:
- La base de datos y el almacenamiento están diseñados para manejar datos persistentes de manera confiable y segura. Este componente es crucial para almacenar la información de la aplicación y los usuarios.
Autoscalamiento:
- Métricas de Monitoreo: Define las condiciones para el autoscalamiento. Por ejemplo, cuando los usuarios superan los 1000, se añade una instancia (+1). Si los usuarios superan los 100K, se añaden más instancias (+4).
- Configuración de Autoscalamiento: Define el número mínimo, deseado y máximo de instancias:
  - Mínimo: 2
  - Deseado: 2
  - Máximo: 8

Explicación de Cada Componente

DNS:
- Gestiona los nombres de dominio y redirige el tráfico entrante al CDN y el WAF.
CDN:
- Caches el contenido estático de la aplicación, como imágenes, videos, y archivos CSS/JS, para mejorar el tiempo de respuesta y la experiencia del usuario.
WAF:
- Monitorea y filtra el tráfico HTTP para proteger la aplicación contra ataques comunes y vulnerabilidades.
API Gateway:
- Actúa como un punto de entrada único para las solicitudes de la API, gestionando la autenticación y autorización, y distribuyendo las solicitudes a los servicios backend adecuados.
Balanceador de Aplicaciones:
- Distribuye el tráfico entrante entre las diferentes instancias de la aplicación ubicadas en distintas zonas de disponibilidad para asegurar que ninguna instancia se sobrecargue.
Instancias de Aplicación (AZ-1 y AZ-2):
- Despliegue de la aplicación en múltiples zonas de disponibilidad (AZs) proporciona redundancia y tolerancia a fallos. Si una zona falla, la otra puede seguir manejando el tráfico.
Base de Datos + Almacenamiento:
- Proporciona almacenamiento persistente para datos de la aplicación y usuarios. Generalmente, se usa una base de datos relacional o NoSQL junto con almacenamiento de objetos para archivos grandes.
Autoscalamiento:
- Monitorea métricas de rendimiento y uso, como el número de usuarios, para ajustar dinámicamente el número de instancias de la aplicación, asegurando que la capacidad se adapte a la demanda.

Ejemplo de Flujo de Trabajo

Un usuario accede a la aplicación a través del dominio platziwallet.com.
La solicitud pasa por el DNS, que redirige al CDN.
El CDN entrega el contenido estático y, si es necesario, pasa la solicitud a través del WAF para seguridad adicional.
La solicitud llega al API Gateway, donde se maneja la autenticación y autorización.
El API Gateway enruta la solicitud al Balanceador de Aplicaciones.
El Balanceador de Aplicaciones distribuye la solicitud a una de las instancias de la aplicación en AZ-1 o AZ-2.
La instancia de la aplicación procesa la solicitud, interactúa con la base de datos si es necesario, y genera una respuesta.
La respuesta es enviada de vuelta al usuario a través del mismo camino, garantizando rapidez y seguridad.

Conclusión

Esta arquitectura es un ejemplo de cómo diseñar aplicaciones escalables, seguras y de alta disponibilidad en la nube. Al usar varias zonas de disponibilidad y mecanismos de autoscalamiento, se asegura que la aplicación puede manejar un gran número de usuarios y mantenerse operativa incluso en caso de fallos.

Caleb Ventura

student•

Por si están trabajando con AWS, les dejo una plantilla para que puedan configurar el autoescalamiento en 2 zonas de disponibilidad.

AWSTemplateFormatVersion: '2010-09-09'
Description: Auto Scaling Example in 2 Availability Zones

Resources:
  MyLaunchConfiguration:
    Type: AWS::AutoScaling::LaunchConfiguration
    Properties: 
      ImageId: ami-0abcdef1234567890
      InstanceType: t2.micro
      SecurityGroups: 
        - !Ref MySecurityGroup
      KeyName: my-key-pair

  MyAutoScalingGroup:
    Type: AWS::AutoScaling::AutoScalingGroup
    Properties:
      VPCZoneIdentifier:
        - subnet-12345678
        - subnet-87654321
      LaunchConfigurationName: !Ref MyLaunchConfiguration
      MinSize: '1'
      MaxSize: '5'
      DesiredCapacity: '2'
      TargetGroupARNs:
        - !Ref MyTargetGroup
      HealthCheckType: EC2
      HealthCheckGracePeriod: 300
      Tags:
        - Key: Name
          Value: MyAutoScalingInstance
          PropagateAtLaunch: true

  MyScalingPolicy:
    Type: AWS::AutoScaling::ScalingPolicy
    Properties:
      AutoScalingGroupName: !Ref MyAutoScalingGroup
      PolicyType: TargetTrackingScaling
      TargetTrackingConfiguration:
        PredefinedMetricSpecification:
          PredefinedMetricType: ASGAverageCPUUtilization
        TargetValue: 50.0

  MySecurityGroup:
    Type: AWS::EC2::SecurityGroup
    Properties:
      GroupDescription: Enable SSH access
      VpcId: vpc-12345678
      SecurityGroupIngress:
        - IpProtocol: tcp
          FromPort: '22'
          ToPort: '22'
          CidrIp: 0.0.0.0/0

  MyTargetGroup:
    Type: AWS::ElasticLoadBalancingV2::TargetGroup
    Properties:
      VpcId: vpc-12345678
      Port: 80
      Protocol: HTTP
      HealthCheckProtocol: HTTP
      HealthCheckPort: '80'
      HealthCheckPath: /
      Matcher:
        HttpCode: 200
      TargetType: instance

Outputs:
  AutoScalingGroupName:
    Description: Name of the Auto Scaling Group
    Value: !Ref MyAutoScalingGroup

Caleb Ventura

student•

Aqui el grupo de Auto Scaling intentará mantener la utilización promedio de la CPU en aproximadamente el 50% aumentando o disminuyendo el número de instancias según sea necesario. Véase MyScalingPolicy

Bryan Manuel Paz Rodríguez

student•

¿Porqué recomiendas las métricas de monitoreo por User y no por CPU?

Frank Bill Palma Luna

student•

Aunque puedes autoescalar por CPU o RAM, la clase sugiere que la métrica más efectiva es la demanda real, como la cantidad de requests o usuarios. Esto asegura que tu arquitectura se adapte directamente a la carga de trabajo de tu aplicación, no solo a la utilización de recursos.

Jhon Freddy Tavera Blandon

student•

[Cliente: Navegador Web]

| (HTTP)

[Servidor Web: Nginx]

| (HTTP/HTTPS)

[Servidor de Aplicaciones: Node.js/Express]

| (SQL)

[Servidor de Base de Datos: PostgreSQL]

Fabio Emilio Buiza Lopez

student•

Super claro todo realmente. Se puede uno imaginar lo que sucede en la nube. Gracias.

Jose Luis Flores

student•

En el ejemplo e la auto escalabilidad , en el caso hipotetico que sea hasta 8 el numero maximo de servidores , pero estoy bajo un ataque DDOS , y el ataque sobrepasa ese maximo se cae el servicio , como me puedo proteger de eso ?

Gildder Guerrero Ramirez

student•

Una arquitectura en servidores en AWS implica diseñar y desplegar aplicaciones basadas en instancias de servidores virtuales, utilizando servicios como EC2 para el alojamiento. Esta arquitectura busca alta disponibilidad y escalabilidad, distribuyendo las cargas de trabajo entre múltiples zonas de disponibilidad. Incluye componentes como balanceadores de carga, grupos de autoescalamiento y bases de datos, asegurando que la infraestructura soporte un aumento en la demanda. Es fundamental considerar la seguridad, el monitoreo y el uso de métricas para optimizar el rendimiento.

Felipe Garcia Gonzalez

student•

Aqui quede un una observacion (no la veo en comentarios), el escalamiento horizontal es inmediato pero ¿ el autoescalamiento si hay un tiempo muerto, unos minutos, en lo que se crean y se validan los nuevos servidores?

Diego Eduardo Téllez Contreras

student•

En el horizontal no hay caida, pero en el vertical si hay caida. Esos son los dos tipos. Recuerda que el vertical es cuando se le aumenta la capacidad al servidor ya existente.

Elisa Zamarron Muñoz

student•

Exacto, no hay caida porque los demás servidores siguen otorgando servicio en lo que los que se despliegan termian de validarse

Puede haber degradacion de servicio pero no una caida (en teoria claro, xd)

Jose Luis Quintero Sánchez

student•

Las siglas AMI significan "Amazon Machine Image". Es una imagen que contiene el sistema operativo, las aplicaciones y las configuraciones necesarias para lanzar instancias de servidores en la nube de Amazon Web Services (AWS). Las AMIs permiten una rápida implementación y replicación de servidores, facilitando el autoescalamiento y la alta disponibilidad en arquitecturas en la nube.

ANDRES ALFONSO MIRA MEJIA

student•

✅

Diego Fernando Castelblanco Jimenez

student•

En el contexto de Cloud Computing, una AMI (Amazon Machine Image) es una imagen que contiene el sistema operativo, las aplicaciones y configuraciones necesarias para crear instancias en Amazon EC2 (Elastic Compute Cloud). Facilita la implementación y escalabilidad de aplicaciones al permitir que se inicien nuevas instancias de servidores rápidamente. Puedes crear y personalizar AMIs según tus necesidades, lo que mejora la eficiencia al desplegar aplicaciones en servidores en la nube.

Mario Alexander Vargas Celis

student•

🏗️ Arquitectura Base con Servidores

📌 ¿Qué es una Arquitectura con Servidores?

Es un diseño tradicional donde las aplicaciones y servicios se ejecutan en servidores físicos o virtuales, en lugar de una arquitectura serverless o basada completamente en contenedores.

✅ Usos comunes:

Aplicaciones empresariales con alta personalización.
Sistemas legados que requieren infraestructura dedicada.
Aplicaciones con control total sobre hardware y software.

🔧 Componentes Clave de una Arquitectura Base con Servidores

1️⃣ Capa de Presentación (Front-end)

Servidor web para atender peticiones HTTP/HTTPS.
Ejemplos: NGINX, Apache, IIS.
Puede estar en servidores dedicados o balanceados en varias máquinas.

2️⃣ Capa de Aplicación (Back-end)

Servidores donde corre la lógica del negocio.
Tecnologías: Node.js, Python (Django/Flask), Java (Spring Boot), .NET, Ruby on Rails.
Puede ser monolítica o basada en microservicios.

3️⃣ Capa de Base de Datos

Bases de datos relacionales: PostgreSQL, MySQL, SQL Server.
Bases de datos NoSQL: MongoDB, Cassandra, Redis.
Puede estar en un solo servidor o en un clúster de alta disponibilidad.

4️⃣ Capa de Almacenamiento

Servidores de archivos para almacenar documentos, imágenes, etc.
Ejemplo: NAS, SAN, NFS o almacenamiento en la nube (S3, MinIO).

5️⃣ Capa de Seguridad

Firewall para proteger la red.
VPN o acceso seguro SSH.
Certificados SSL/TLS para cifrar la comunicación.
Autenticación y autorización con OAuth2, LDAP o Active Directory.

6️⃣ Capa de Balanceo de Carga

Distribuye el tráfico entre múltiples servidores de aplicación.
Ejemplo: NGINX, HAProxy, AWS ELB, Azure Load Balancer.

7️⃣ Monitoreo y Logging

Monitoreo: Prometheus + Grafana, Nagios, Zabbix.
Logging: ELK Stack (Elasticsearch, Logstash, Kibana).
Auditoría: Graylog, Fluentd.

📐 Ejemplo de Arquitectura con Servidores

[ Cliente ] <---> [ Balanceador de Carga ] <---> [ Servidores Web (Apache/NGINX) ] | v [ Servidores de Aplicación ] | v [ Servidores de Base de Datos ] | v [ Almacenamiento (NAS/S3) ]

✅ Escalabilidad: Puede ser vertical (máquinas más potentes) o horizontal (agregar más servidores). ✅ Disponibilidad: Puede usar clústeres y replicación de bases de datos.

🚀 Conclusión

Esta arquitectura ofrece control total sobre la infraestructura y es ideal para sistemas con altos requerimientos de personalización y seguridad. Sin embargo, requiere mayor mantenimiento que una solución basada en la nube o serverless.

Ismael Cruz Procel

student•

Alguien sabe como se llama el software con el que diagramo?

Yordy Alejandro Jiménez Torres

student•

Hola Prof, en las preguntas para la evaluación hay una que dice: Al crear un servidor en nuestro proveedor de servicios cloud ¿Cómo es el costo del mismo? Respondí que el costo es mensual y me dice que es incorrecto y realmente en esta clase se señala que es por mes

Wilbert J Galano Batista

student•

Aun no he tomado el test voy por la clase 24 lo que planteas esta correcto pero creo que aplica mas a como es el Billing cicle que es por mes como bien dices , en fin creo que la respuesta que seguro toman como correcta es que el costo del mismo es por demanda (pay as you go ) ya que segun el tipo de servidor T2 , T3 , M5 etc y según los recursos que tu pidas o configures(RAM , MICRO, HDD) es como te cobran. Espero estar en lo correcto cuando hago el test final del curso saldré de dudas jajaja

Felipe Garcia Gonzalez

student•

El costo es por segundo o minuto

Cesar Augusto Silva Ruiz

student•

Para configurar el autoescalado en AWS Fargate basado en la cantidad de solicitudes, debes usar Amazon CloudWatch. Primero, asegúrate de habilitar el registro de métricas de tus servicios Fargate. Puedes configurar métricas personalizadas que cuenten las solicitudes. Luego, crea una alarma en CloudWatch para estas métricas.

Configura las políticas de autoescalado en AWS Application Auto Scaling, donde puedes establecer el objetivo de escalado basado en la cantidad de solicitudes. Utiliza la métrica de conteo de solicitudes para definir cuándo escalar hacia arriba o hacia abajo.

Arquitectura de Servidores para Escalabilidad y Alta Disponibilidad

Introducción al curso

Fundamentos de Cloud Computing para Desarrolladores y Empresas

Aplicación de Billetera Virtual: Conceptos y Funcionalidades Básicas

Cómo entender la nube

Conceptos Básicos de Servidores y Almacenamiento en la Nube

Tipos de Bases de Datos en la Nube: Relacional, No Relacional y Más

Infraestructura como Código y Microservicios en la Nube

Comparación entre On-Premises y Nube para Aplicaciones Empresariales

Introducción a Cloud Computing / Nube

Introducción a Cloud Computing: Conceptos y Beneficios de la Nube

Ventajas de Usar Cloud Computing para Empresas y Desarrolladores

Cambios al Implementar Platzi Wallet en la Nube

Infraestructura Global en la Nube: Regiones y Zonas de Disponibilidad

Modelos de Nube: Privada, Pública, Híbrida y Multinube

Conceptos de Cloud Computing / Nube

Conceptos y Beneficios de Cloud Native en Desarrollo de Aplicaciones

Arquitectura Cloud Native: Construcción de Aplicaciones Escalables

Arquitectura Serverless: Ventajas y Retos en Cloud Computing

Componentes clave en arquitecturas serverless

Patrón síncrono en arquitecturas serverless con Platzi Wallet

Principales Proveedores de Servicios Cloud y Sus Ventajas

Multi-Nube

Tipos de Lock-in en Arquitectura de Nube

Estrategias de Multinube: Cómo Elegir y Optimizar Proveedores de Nube

Modelos de servicio en Cloud Computing / Nube

Modelos de Servicio en la Nube: IaaS, PaaS y SaaS

Características de una arquitectura en Cloud Computing /Nube

Alta Disponibilidad y Tolerancia a Fallos en Arquitectura de Nube

Escalabilidad en la Nube: Vertical vs Horizontal y Alta Disponibilidad

Construyendo nuestra arquitectura

Diagramación de Arquitectura Agnóstica para Aplicaciones

Arquitectura de Servidores para Escalabilidad y Alta Disponibilidad

Arquitectura de Aplicaciones con Contenedores y Kubernetes

Arquitectura Serverless: Diseño y Escalabilidad de Funciones

Conceptos Clave de Arquitectura en la Nube