Configuración de Escalamiento en Google Cloud Run

Clase 35 de 42 • Curso de Google Cloud Platform para E-commerce

Resumen

¿Cómo evitar el colapso de tu aplicación con Google Cloud Run?

En medio de un mundo cada vez más digital, no hay nada peor que una aplicación que se cae debido a un tráfico inesperadamente elevado. Ser víctima de tu propio éxito es una situación que puede evitarse al gestionar adecuadamente las opciones de escalamiento en Google Cloud Run. Vamos a descubrir cómo aprovechar al máximo estas herramientas.

¿Qué opciones de escalamiento ofrece Google Cloud Run?

La clave del éxito con Cloud Run está en entender sus dos fundamentales: el escalamiento horizontal y el escalamiento vertical.

Escalamiento horizontal:
- Cloud Run ofrece la posibilidad de tener hasta mil instancias por servicio.
- Cada instancia puede manejar hasta 80 peticiones concurrentes.
- Esto significa que, con la configuración adecuada, puedes manejar miles de solicitudes simultáneamente.
Escalamiento vertical:
- Aquí, cada instancia puede ser ajustada para tener entre 1 y 4 CPUs.
- La memoria puede configurarse en cualquier valor entre 128 MB y 4 GB.

El gran diferencial de Cloud Run frente a otras soluciones serverless es su capacidad de escalar a cero, lo que significa que no tendrá instancias corriendo cuando no se esté usando, lo que se traduce en ahorro de costos.

¿Cómo podemos configurar estas opciones en la consola de Google Cloud?

Configurar adecuadamente tus opciones de escalamiento es esencial para superar cualquier desafío potencial. Aquí te doy una guía rápida sobre cómo hacerlo:

Crear un nuevo servicio:
- Vamos a la consola, allí puedes crear un nuevo servicio nombrado adecuadamente.
- Selecciona la imagen desde la cual se lanzará tu servicio, como por ejemplo, una generada por Buildpack.
Configuración avanzada:
- Configura el puerto donde escuchará tu aplicación, generalmente el 8080.
- Sistema de inicio de aplicación: define los comandos como Python main.py.
- Elige la memoria entre 128 MB y 4 GB. Recuerda que se puede personalizar, por ejemplo, a 345 MB.
Ajustes de CPU y ejecución:
- Decide entre 1, 2 o 4 CPUs según la carga esperada.
- Configura el time out para tareas largas, teniendo siempre en cuenta que el máximo es 3600 segundos.

¿Cuáles son las ventajas de Cloud Run sobre Cloud Functions?

Elegir entre Cloud Run y Cloud Functions puede ser complicado, pero Cloud Run tiene características destacadas:

Capacidad de manejar múltiples peticiones simultáneas: Mientras que Cloud Functions permite solo una petición por instancia, Cloud Run puede manejar hasta 80.
Flexibilidad en el runtime: Puedes personalizar el entorno operativo, lo cual permite usar cualquier versión de los lenguajes de programación con los que desees trabajar.
Ahorro económico: Al poder manejar múltiples peticiones en una sola instancia, reduce los costos en comparación con crear nuevas instancias por cada solicitud.

¿Cómo optimizar el escalamiento para sacarle el mejor provecho?

La configuración ideal dependerá del tipo de aplicación y de las necesidades específicas del negocio. Aquí algunas recomendaciones:

Minimiza tiempos de espera configurando instancias mínimas si estás usando una aplicación con uso frecuente para evitar el cold start.
Varía recursos de CPU y RAM para encontrar el equilibrio exacto entre costo y rendimiento, lo ideal es ensayar distintas configuraciones.
Utiliza Variables de Entorno para reducir el hardcodeo y mejorar la gestión de secretos con herramientas como Secret Manager.

Para maximizar el rendimiento, es esencial conocer y entender a fondo las necesidades de tu aplicación. El camino es probar, ajustar y repetir hasta encontrar la configuración más óptima que se adapte a las demandas de tus usuarios y a tu presupuesto. ¡No te desanimes y sigue explorando nuevas maneras de mejorar tus aplicaciones con tecnología de punta!

Configuración de Escalamiento en Google Cloud Run

Retail Store en Google Cloud Platform

Google Cloud para Retail: Optimización y Modernización en E-commerce

MLOps: Integración y Operacionalización en Ciencia de Datos Retail

Arquitectura de Alto Nivel para Aplicaciones en la Nube

Desarrollo de Aplicaciones con Firebase y Vue: Configuración Inicial

Firebase: Autenticación y Seguridad en Aplicaciones Web

Instalación y Configuración de Google Cloud y Firebase para Apps

Medición de Interacciones con Google Tag Manager y Analytics

Configuración de Google Tag Manager y Google Analytics

Tageo Avanzado con Google Tag Manager para Customer Lifetime Value

Uso estratégico del Customer Lifetime Value (CLV)

Integración de Servicios y APIs en Arquitecturas Modernas

Exposición de servicios con Apigee

Integración de APIs en Tiendas en Línea

Fundamentos y Creación de APIs con APIG de Google Cloud

Creación y Gestión de APIs con APIG

Creación de API Proxy con APIG y OpenAPI Specification

Creación y Gestión de API Products y Developer Apps

Creación y gestión de portales para desarrolladores con APIG

Configuración de Portales para Desarrolladores en APIG

Buenas prácticas para desarrollar APIs eficaces

Generación de modelos AI/ML

Datos Estructurados en Machine Learning para Marketing

Modelos de Forecasting y Customer Lifetime Value con BigQuery

Integración de BigQuery con Jupyter para Análisis de Datos

Cuándo usar AutoML Tables vs BigQuery ML en Machine Learning

Entrenamiento de Modelos de Machine Learning con BigQuery ML

Entrenamiento y Evaluación de Modelos con BigQuery ML y Jupyter

Exportación de Modelos en BigQuery ML: Métodos y Consideraciones

Exportación de Modelos de Machine Learning a Cloud Storage

Consumo de servicios de AI/ML

Despliegue de Modelos Machine Learning en Google Cloud Run

Introducción a Kubernetes y su Uso en la Orquestación de Contenedores

Implementación de Modelos de Machine Learning con BigQuery API

Almacenamiento de Predicciones con Google Cloud Storage y BigQuery

Implementación de Modelos ML en BigQuery y Almacenamiento en GCS

Despliegue Continuo con Google Cloud: Herramientas y Estrategias

Despliegue Continuo en Google Cloud con Cloud Run y Docker