No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Escalabilidad y desempeño

14/19
Recursos

¿Cómo se despliegan y configuran aplicaciones en Google Cloud Run?

El despliegue de aplicaciones en Google Cloud Run no solo se trata de poner en producción el software; también implica asegurarse de que funcione de manera óptima. Esto requiere conocimiento sobre las opciones de configuración, la escalabilidad y el manejo del tráfico entre versiones. En este artículo, exploraremos cómo manejar estas configuraciones aprovechando las características de autoscaling y administrar el tráfico en distintas versiones para garantizar un rendimiento eficiente.

¿Cuál es el enfoque de escalabilidad en Cloud Run?

Las aplicaciones en Cloud Run pueden escalar a cero, es decir, pueden iniciar desde ningún recurso en uso y escalar según lo requiera la aplicación. Esto se complementa con características como Service Invocation, que permiten que la aplicación pase del estado de inactividad a uno activo sin errores de solicitud. La escalabilidad no solo es horizontal (añadiendo más instancias), sino también vertical, aumentando los recursos de cada instancia.

Entre sus capacidades de configuración están:

  • Memoria asignada a las instancias: Desde 128 MB hasta 2 GB.
  • Número de instancias: Desde 0 hasta 1000 instancias. Para más de 1000, se requiere justificación a los equipos de ingeniería.
  • Peticiones por contenedor: Predeterminado a 20, pero configurable según el caso de uso.
  • Tiempo máximo de ejecución: 300 segundos, que puede extenderse para tareas largas.

¿Cómo hacer ajustes en las configuraciones de Cloud Run?

Configuración en la versión administrada

Al trabajar con una versión administrada de Cloud Run, se pueden ajustar:

  • Memoria y solicitudes máximas: Puede asignar valores personalizados para la memoria (como 384 MB) y ajustar el límite de solicitudes.
  • Manejo del tráfico: En versiones como para Antos, se puede redirigir el tráfico entre varias versiones (por ejemplo, 5% a una nueva versión en prueba, 95% a la estable).
  • Autoescalado: Aunque la versión administrada comienza desde cero, en Antos se puede configurar para mantener un mínimo de instancias activas.

Configuración en la versión para Antos

Para Antos, una solución orientada a Kubernetes, se pueden realizar ajustes adicionales:

  • Asignación de CPUs y memoria: Ajustes en el número de CPUs y memoria RAM, según la capacidad del clúster.
  • Manejo del tráfico: Similar a la versión administrada, pero con más control sobre el porcentaje de tráfico.
  • Instancias mínimas: Se puede configurar para que siempre haya al menos una instancia lista, sin llegar a cero.

¿Qué ventajas ofrece el manejo del tráfico y las revisiones?

El manejo de tráfico y versiones en Cloud Run permite controlar mejor cómo las nuevas versiones de aplicaciones se introducen en producción, especialmente útil para:

  • Canarias o pruebas A/B: Permite lanzar actualizaciones a una pequeña parte de los usuarios antes de un despliegue completo.
  • Revertir cambios si algo falla: Si una nueva versión descubre un problema, el tráfico se puede redirigir completamente a una versión estable.

Este enfoque flexible y controlado facilita la experimentación y aumenta la estabilidad del servicio ofrecido a los usuarios.

La capacidad de manipular versiones y manejar tráfico asegura que siempre puedes actuar rápidamente ante imprevistos, garantizando una experiencia óptima para el usuario final.emoji_pizza

Aportes 3

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

en que difiere cloud run for anthos contra solo cloud run, pero me refiero a costos

Interesante con un balanceo de trafico