Introducción a Kubernetes y su Uso en la Orquestación de Contenedores

Clase 29 de 42 • Curso de Google Cloud Platform para E-commerce

Contenido del curso

Retail Store en Google Cloud Platform

Exposición de servicios con Apigee

Generación de modelos AI/ML

Consumo de servicios de AI/ML

Google Marketing Platform

Tomar examen

Resumen

Gestionar un contenedor es sencillo, pero cuando hablamos de decenas, centenas o miles, la complejidad crece de forma exponencial. Aquí es donde entra Kubernetes como plataforma de orquestación, y donde soluciones como Cloud Run y Knative llevan la experiencia un paso más allá al combinar contenedores con el modelo serverless. Entender cómo se relacionan estas piezas es fundamental para diseñar arquitecturas modernas, escalables y eficientes en costos.

¿Qué es Kubernetes y por qué resuelve los problemas del día dos?

Kubernetes es una plataforma open source creada por Google, presentada en sociedad en 2014 y entregada a la Cloud Native Computing Foundation en 2015 [1:00]. Al ser un proyecto donado, cualquier compañía puede tomar el código y ofrecer su propia versión; Google, por ejemplo, tiene Google Kubernetes Engine (GKE), cuyo objetivo es facilitar la administración de un cluster de Kubernetes.

La idea central es una abstracción de la infraestructura [1:30]. En lugar de preocuparte por cuántos servidores tienes o qué sistemas operativos corren, piensas en un pool de recursos de cómputo: tanta memoria RAM, tanto CPU, todo disponible para las aplicaciones desplegadas como contenedores.

¿Cómo funciona la arquitectura interna de Kubernetes?

A alto nivel, Kubernetes expone una API que permite interactuar con el control plane [2:08]. Este control plane es la colección de funcionalidades encargada de gestionar los distintos nodos. Puedes manejarlo desde una interfaz gráfica (UI) o desde la línea de comandos con kubectl [2:50].

Dentro del control plane encontramos componentes clave:

Scheduler: decide en qué nodo se ejecuta cada carga de trabajo.
Controller manager: controla políticas de replicación.
Servicios y namespaces: organizan y aíslan recursos.

¿Qué papel juegan los nodos y los pods?

Cada nodo representa una unidad de cómputo con una cantidad definida de RAM y CPU [3:05]. Dentro de los nodos viven los pods, que son la unidad lógica mínima donde corren tus contenedores. El pod garantiza la asignación de recursos y permite controlar si una aplicación queda expuesta a Internet o solo se comunica con otros servicios dentro del cluster [3:30].

¿Cómo nació Cloud Run a partir de los aprendizajes de Google?

Google no empezó con Kubernetes Engine. Su primer gran producto de plataforma fue App Engine [4:05], un servicio de Platform as a Service (PaaS) donde lanzabas aplicaciones en Java, Python, Node, Ruby o Go sin preocuparte por sistemas operativos. Funcionaba bien, pero no se ajustaba a todas las necesidades.

Después llegaron las Cloud Functions como oferta serverless, y más adelante Kubernetes Engine. Al evaluar las ventajas de cada uno, surgió Cloud Run [4:45]:

Portabilidad de contenedores heredada de Kubernetes.
Abstracción de infraestructura al estilo App Engine.
Modelo serverless similar a Cloud Functions.

Cloud Run es la suma de esos aprendizajes, y su nombre como proyecto open source es Knative [5:15]. Si Kubernetes ya abstrae la infraestructura, Knative es una capa adicional sobre Kubernetes que elimina la necesidad de convertirse en experto para aprovechar los contenedores en modo serverless.

¿Qué ventajas ofrece Knative para arquitecturas de microservicios?

Knative tiene dos grandes componentes: uno orientado a eventos y otro a servir contenido [5:45]. En la parte de servir contenido defines servicios que pueden comunicarse entre sí o quedar expuestos para aplicaciones externas, lo que lo convierte en una opción ideal para arquitecturas basadas en microservicios.

Cada servicio tiene:

Una ruta (URL) para recibir peticiones.
Mecanismos para configurar múltiples revisiones o versiones del servicio.

¿Cómo distribuir tráfico entre versiones con Istio?

Istio [6:20] es otro proyecto open source que permite distribuir tráfico y regular la comunicación entre servicios. Dentro de Cloud Run puedes repartir el tráfico entre revisiones: 20 % a la revisión uno, 30 % a la dos y 50 % a la tres. Esto habilita experimentos como probar un nuevo landing page con un grupo de usuarios, hacer un rollout gradual si funciona, o revertir instantáneamente ante una falla [6:50].

La gran ventaja adicional es el escalado a cero [7:20]. Cuando nadie usa tu aplicación, no pagas nada porque no hay cómputo activo. Cuando llega una nueva solicitud, el servicio se activa y atiende las peticiones.

¿Ya has experimentado con Cloud Run o Knative para tus proyectos? Comparte tu experiencia y las dudas que te hayan surgido.

Introducción a Kubernetes y su Uso en la Orquestación de Contenedores

Retail Store en Google Cloud Platform

Google Cloud para Retail: Optimización y Modernización en E-commerce

MLOps: Integración y Operacionalización en Ciencia de Datos Retail

Arquitectura de Alto Nivel para Aplicaciones en la Nube

Desarrollo de Aplicaciones con Firebase y Vue: Configuración Inicial

Firebase: Autenticación y Seguridad en Aplicaciones Web

Instalación y Configuración de Google Cloud y Firebase para Apps

Medición de Interacciones con Google Tag Manager y Analytics

Configuración de Google Tag Manager y Google Analytics

Tageo Avanzado con Google Tag Manager para Customer Lifetime Value

Uso estratégico del Customer Lifetime Value (CLV)

Integración de Servicios y APIs en Arquitecturas Modernas

Exposición de servicios con Apigee

Integración de APIs en Tiendas en Línea

Fundamentos y Creación de APIs con APIG de Google Cloud

Creación y Gestión de APIs con APIG

Creación de API Proxy con APIG y OpenAPI Specification

Creación y Gestión de API Products y Developer Apps

Creación y gestión de portales para desarrolladores con APIG

Configuración de Portales para Desarrolladores en APIG

Buenas prácticas para desarrollar APIs eficaces

Generación de modelos AI/ML

Datos Estructurados en Machine Learning para Marketing

Modelos de Forecasting y Customer Lifetime Value con BigQuery

Integración de BigQuery con Jupyter para Análisis de Datos

Cuándo usar AutoML Tables vs BigQuery ML en Machine Learning

Entrenamiento de Modelos de Machine Learning con BigQuery ML

Entrenamiento y Evaluación de Modelos con BigQuery ML y Jupyter

Exportación de Modelos en BigQuery ML: Métodos y Consideraciones

Exportación de Modelos de Machine Learning a Cloud Storage

Consumo de servicios de AI/ML

Despliegue de Modelos Machine Learning en Google Cloud Run

Introducción a Kubernetes y su Uso en la Orquestación de Contenedores

Implementación de Modelos de Machine Learning con BigQuery API

Almacenamiento de Predicciones con Google Cloud Storage y BigQuery

Implementación de Modelos ML en BigQuery y Almacenamiento en GCS

Despliegue Continuo con Google Cloud: Herramientas y Estrategias

Despliegue Continuo en Google Cloud con Cloud Run y Docker

Configuración de Escalamiento en Google Cloud Run

Control de Autenticación y Autorización en Google Cloud Run

Google Marketing Platform

Google Cloud Platform para Estrategias de Marketing Digital

Integración de Google Analytics con BigQuery para Segmentación Avanzada

Análisis de Datos con SQL y Modelos K-Means en Google Analytics

Creación y Evaluación de Modelos en BigQuery con Datos de Google Analytics

Segmentación de Audiencias en BigQuery y Predicciones de Compra

Integración de Audiencias en Google Marketing Platform