Opciones de escalabilidad: Templates y Grupos

Clase 11 de 20 • Curso de Google Compute Engine

Contenido del curso

Introducción a Compute Engine

Creación y configuración de una Máquina Virtual

Opciones de almacenamiento

Comunicación

Escalabilidad

Gestión de accesos

Supervisión

Seguridad

19
Seguridad y buenas prácticas en Compute Engine
12:00 min

Cierre

20
Cierre del curso
02:37 min

Tomar examen

Resumen

Construir aplicaciones que soporten crecimiento explosivo sin arruinar tu presupuesto es uno de los retos más importantes al trabajar con servicios de nube pública. En Google Cloud Platform, las máquinas virtuales siguen siendo una herramienta poderosa para lograrlo, siempre y cuando conozcas los mecanismos correctos para escalar de forma inteligente y elástica.

Cuando tu aplicación empieza a recibir más tráfico del esperado, es común que un porcentaje significativo de usuarios obtenga errores 500 o tiempos de carga extremadamente largos [0:42]. Eso destruye la confianza en tu producto. La clave está en diseñar soluciones que se adapten a la demanda sin sobreaprovisionamiento, pagando solo por lo que realmente usas.

¿Por qué las máquinas virtuales siguen siendo relevantes?

Existe una tendencia a rechazar las máquinas virtuales en favor de contenedores y Kubernetes, pero elegir tecnología por moda puede generar más problemas que soluciones [2:08]. Si tu equipo domina las máquinas virtuales y se siente cómodo con ellas, lo más sensato es buscar las herramientas adecuadas dentro de ese paradigma para resolver problemas de escalabilidad.

La elasticidad no solo significa crecer. También implica reducir recursos cuando la demanda baja [2:48]. Si los viernes a las seis de la tarde tu sistema recibe un pico de uso, pero el resto de la semana el tráfico es mínimo, no tiene sentido pagar por toda esa capacidad ociosa.

¿Cuál es la diferencia entre escalamiento vertical y horizontal?

El escalamiento vertical consiste en aumentar memoria y capacidad de procesamiento a una sola máquina virtual [3:34]. Es la opción más simple de administrar porque tienes una sola entidad. Sin embargo, presenta un problema crítico: si esa máquina falla, todos tus usuarios quedan sin servicio. Tienes un único punto de falla.

El escalamiento horizontal propone un enfoque distinto [4:05]:

Utilizar varios servidores pequeños y acotados al mínimo necesario.
Crear nuevas instancias conforme llegan más usuarios.
Distribuir el tráfico entre todas las máquinas.
Reducir instancias cuando la demanda disminuye.

Esto requiere aprender a usar servicios que permitan manejar el clúster completo y distribuir tráfico de forma consistente.

¿Qué son los instance templates?

Un instance template es la especificación de una máquina virtual que funciona como plantilla [4:42]. Defines nombre, sistema operativo, tamaño de disco, red, RAM, procesamiento y metadatos, pero no se materializa en una instancia real. Es una receta que el sistema seguirá para replicar máquinas idénticas cuando sea necesario.

¿Cómo funcionan los instance groups?

Los grupos de instancias vienen en dos tipos [5:28]:

No administrados (unmanaged): agrupan máquinas con características diferentes bajo un nombre lógico. Puedes tener un servidor Windows con .NET, un CentOS con otra aplicación y un Debian con Python, cada uno en puertos distintos [5:48]. No hay escalamiento automático; tú gestionas manualmente el tráfico. Esta opción es ideal para sistemas legacy diversos que necesitas migrar a la nube mientras estandarizas tu base de código [6:42].
Administrados (managed instance groups o MIG): todas las máquinas son idénticas porque se crean a partir de un instance template [7:04]. Aquí sí existe escalamiento automático. Google Cloud crea nuevas instancias según la demanda y puede llegar hasta mil máquinas virtuales por grupo [7:28].

¿Cómo se integra un balanceador de carga con los grupos administrados?

Puedes tener varios grupos de instancias administrados dentro del mismo proyecto y combinarlos con un balanceador de carga (load balancer) [7:40]. Esto permite distribuir tráfico geográficamente: si vendes en el continente americano y en Europa, el balanceador decide a qué región enviar cada solicitud según la ubicación del usuario.

Los grupos administrados también incluyen mecanismos de supervisión para garantizar que las instancias estén en buen estado [8:18]. Si una máquina presenta problemas, el sistema puede reemplazarla automáticamente.

Con estos elementos, las máquinas virtuales en Google Cloud se convierten en una base sólida para construir arquitecturas que crecen y se contraen según la demanda real. Si ya trabajas con instance templates y managed instance groups, comparte tu experiencia y cuéntanos cómo has resuelto tus retos de escalabilidad.

Jonnathan Ramiro Juma Jara

student•

migrar a kubernetes en un gran salto y se necesita saber el momento correcto para empezar una migración y evaluar el impacto con aplicaciones poco concurridas para un primer escenario

Diego Garcia

excelente clase

Sergio Rubiano

Muy bien todo, especialmente de como distribuir el trafico.

Luis Manuel Nieto Hinojosa

muy interesante

Opciones de escalabilidad: Templates y Grupos

Introducción a Compute Engine

¡Antes de comenzar lee esto! Curso en renovación

Cómputo en Google Cloud Platform

¿Qué es la virtualización, una VM y Compute Engine?

Empezando en Google Cloud Platform

Creación y configuración de una Máquina Virtual

Crear una Máquina Virtual

Configuración de una Máquina Virtual

Opciones de almacenamiento

Elegir la mejor opción de almacenamiento

Creación y gestión de tareas con recursos de almacenamiento

Comunicación

Servicios de Red

Práctica: Servicios de Red

Escalabilidad