Flujo de Trabajo en Vertex AI: Integración y Despliegue de Modelos

Clase 12 de 19 • Curso de Big Data y Machine Learning con Google Cloud Platform

Contenido del curso

Manejo de Big Data

Herramientas de inteligencia artificial

Proyecto: Clon de Google Photos (Parte 4 de 4)

Resumen

Construir modelos de machine learning de principio a fin dentro de una sola plataforma ya no es un reto reservado a grandes equipos de ingeniería. Vertex AI de Google Cloud reúne ciencia de datos, entrenamiento, evaluación y despliegue en un único entorno, permitiendo que distintos perfiles —desde data analysts hasta ML developers— colaboren de forma eficiente y escalen sus soluciones con la metodología de MLOps.

¿Cómo se transforma un equipo con Vertex AI?

La propuesta de Vertex AI se sustenta en tres pilares [0:08]:

Integración de machine learning y ciencia de datos en una sola plataforma, evitando la fragmentación de herramientas.
Escalabilidad mediante MLOps, que permite gestionar el ciclo de vida completo de los modelos de forma reproducible.
Aplicaciones de inteligencia artificial fáciles de desplegar, orientadas a resolver casos de uso en múltiples industrias.

Esta visión integral elimina fricciones entre equipos y acelera el paso de un prototipo a producción.

¿Qué pasos componen el flujo de datos y entrenamiento?

El flujo comienza con la definición del esquema de datos y la variable target [0:42]. Para ello se utiliza BigQuery como almacén central de datos, mientras que Dataflow se encarga de las ingestas y transformaciones necesarias para preparar la información. El análisis exploratorio —distribuciones, valores nulos, mínimos, máximos y categorías— se realiza en Jupyter Notebooks directamente dentro de la plataforma [1:16].

Una vez que los datos están listos, el proceso avanza hacia el entrenamiento con Vertex Training [1:38], un servicio que permite entrenar modelos sin aprovisionar infraestructura. Tras el entrenamiento se evalúan los resultados y, cuando son satisfactorios, se despliegan mediante Vertex Prediction [1:55], que soporta predicciones en tiempo real y por lotes (batch).

¿Qué rol utiliza cada servicio dentro de Google Cloud?

La plataforma ofrece diferentes puntos de entrada según el perfil del usuario [2:07]:

Data scientist: puede usar Vertex Training, AutoML en Vertex AI y BigQuery ML.
ML developer: trabaja principalmente con AutoML y BigQuery ML.
Data analyst: aprovecha BigQuery ML para construir modelos con SQL, sin necesidad de programar en Python.

Esta matriz de roles y servicios facilita que cada persona contribuya con las herramientas adecuadas a su experiencia.

¿Cómo funciona AutoML dentro de Vertex AI?

AutoML automatiza gran parte del proceso que un data scientist haría manualmente [2:41]. El flujo interno sigue estos pasos:

Definición del esquema y la variable objetivo.
Análisis automático de características: detección de datos perdidos, valores extremos y distribución de categorías.
Ingeniería de variables (feature engineering) y prueba de múltiples algoritmos disponibles en la biblioteca interna de AutoML.
Ajuste de hiperparámetros para cada modelo candidato.
Selección del mejor modelo y presentación de los resultados de evaluación, incluyendo la importancia de variables ordenada de mayor a menor [3:18].

Una vez validados los resultados, el modelo se despliega en Vertex AI y queda listo para generar predicciones [3:36].

¿Por qué elegir Vertex AI como plataforma de extremo a extremo?

Los puntos más relevantes del flujo de trabajo se resumen en cuatro ideas clave [3:47]:

Proceso end-to-end: ingesta, entrenamiento y despliegue conviven en la misma plataforma.
Innovación unificada: Google Cloud integra algoritmos de machine learning desarrollados internamente en un solo producto.
MLOps para optimización continua: la gestión del ciclo de vida de los modelos se sistematiza para garantizar calidad y trazabilidad.
Plataforma centralizada: todo el esfuerzo de innovación converge en Vertex AI, simplificando la operación diaria.

Si ya estás explorando Google Cloud, el siguiente paso natural es abrir la consola y probar cada uno de estos servicios en una sesión práctica. ¿Has trabajado con alguno de estos componentes? Comparte tu experiencia en los comentarios.

Comentarios

nicolas pozzi

student•

Como transformar equipos con VertexAi -Machine learning y ciencia de datos unificados -Streamline y escalabilidad con MLOps -Aplicaciones de IA fáciles de desplegar

Vertex Ai Definir esquemas de datos y el target - Analisis de features de entradas- Entrenamiento - evaluacion del comportamiento del modelo - Despliegue del modelo para generar predicciones

Auto ML en Vertex Ai Definir esquema de datos y target - Analisis de features de entrada - entrenar modelo (feature engineering, selección de modelo, Ajustes de hiper parámetros) - Evaluar comportamientos del modelo - Desplegar modelos para generar predicciones

Jorge Martínez Gómez

student•

Me parece increíble que hablen en la clase de Auto ML, y ni den una mínima definición o que es o que hace. Lo mismo con Vertex AI y con todo. Es terrible.

Dave Sanchfor

student•

Ojala En el Avance del curso se profundice el tema un poco mas. porque lo siento bastante informativo, aunqe esta bien explicado, "muy plastilina", eso es un punto positivo, ya que se enfoca en el entendiemiento para todo tipo de personas.

Jhon Freddy Tavera Blandon

student•

Actualizando la clase

Flujo de trabajo con Vertex AI

1. Preparación de Datos:

Ingestión de Datos: Importa tus datos desde diferentes fuentes como Google Cloud Storage, BigQuery u otras fuentes de datos externas.
Limpieza y Transformación: Utiliza herramientas como Dataflow, BigQuery o Cloud Dataprep para limpiar, transformar y preparar tus datos para el entrenamiento de modelos.

2. Desarrollo de Modelos:

Selección de Algoritmos: Elige los algoritmos de aprendizaje automático adecuados para tu problema (regresión, clasificación, clustering, etc.).
Entrenamiento de Modelos: Utiliza Vertex AI para entrenar modelos utilizando AutoML (aprendizaje automático automático) o entrenamiento personalizado con TensorFlow, PyTorch u otras bibliotecas de ML.

3. Evaluación de Modelos:

Validación Cruzada: Evalúa el rendimiento de tus modelos utilizando técnicas de validación cruzada para garantizar su generalización.
Métricas de Evaluación: Analiza métricas como precisión, recall, F1-score, ROC-AUC, entre otras, para evaluar la calidad de tus modelos.

4. Optimización de Modelos:

Búsqueda de Hiperparámetros: Utiliza herramientas de optimización de hiperparámetros para encontrar la configuración óptima de tu modelo.
Ajuste de Hiperparámetros: Experimenta con diferentes valores de hiperparámetros para mejorar el rendimiento y la generalización de tus modelos.

5. Implementación y Despliegue:

Despliegue de Modelos: Implementa tus modelos entrenados como servicios API para realizar predicciones en tiempo real o en lotes.
Escalabilidad Automática: Vertex AI escala automáticamente los recursos de cómputo según la carga de trabajo y la demanda de predicciones.

6. Monitoreo y Gestión:

Monitoreo en Producción: Supervisa el rendimiento de tus modelos en producción, incluyendo métricas de latencia, uso de recursos y precisión.
Alertas y Notificaciones: Configura alertas y notificaciones para detectar desviaciones en el rendimiento de tus modelos y tomar medidas correctivas.

7. Actualización y Mantenimiento:

Actualización de Modelos: Realiza actualizaciones periódicas de tus modelos para mantener su precisión y relevancia.
Reentrenamiento Automático: Configura el reentrenamiento automático de modelos para adaptarse a cambios en los datos o en el entorno.

8. Análisis y Visualización:

Análisis de Resultados: Utiliza herramientas de análisis y visualización como BigQuery, Data Studio o AI Explanations para comprender y explicar los resultados de tus modelos.
Interpretación de Modelos: Examina la importancia de las características, la contribución de las variables y la interpretabilidad de tus modelos.

Ventajas del Flujo de Trabajo con Vertex AI:

Integración Completa: Vertex AI ofrece una integración completa de herramientas y servicios de Google Cloud Platform para un flujo de trabajo de extremo a extremo.
Simplicidad: Simplifica el desarrollo y la gestión de modelos de aprendizaje automático con herramientas intuitivas y una interfaz unificada.
Escalabilidad y Rendimiento: Utiliza la infraestructura de Google Cloud para ofrecer escalabilidad automática y alto rendimiento en el entrenamiento y predicción de modelos.
Automatización: Automatiza tareas repetitivas como la búsqueda de hiperparámetros, la implementación de modelos y el monitoreo de rendimiento.

José Ramón García

student•

AutoML en Vertex AI es una herramienta que permite a los usuarios construir y desplegar modelos de machine learning sin necesidad de tener conocimientos avanzados en el tema. Facilita el proceso de entrenamiento de modelos a través de una interfaz automática que analiza los datos, optimiza los hiperparámetros y selecciona el mejor modelo para el problema específico. Utiliza métodos de machine learning para automatizar tareas como la ingeniería de características y la evaluación, permitiendo a los usuarios obtener resultados de calidad de forma eficiente.

Jhon Freddy Tavera Blandon

student•

Documentación de Vertex AI

Flujo de Trabajo en Vertex AI: Integración y Despliegue de Modelos

Manejo de Big Data

Big Data y Machine Learning en Google Cloud Platform

Google Cloud y Big Data: Historia, Servicios y Aplicaciones Prácticas

Google Cloud Platform para Big Data: Arquitectura y Seguridad

Exploración de Servicios Big Data e IA en Google Cloud

Procesamiento de Datos con Cloud Dataflow en Google Cloud

Características y Funcionalidades de BigQuery

Integración de BigQuery con Data Studio: Creación de Dashboards

Funcionamiento de PubSub en Google Cloud y su Integración con Dataflow

Integración de PubSub, Dataflow y BigQuery en Google Cloud

Herramientas de inteligencia artificial

Aplicación de Machine Learning en Industrias y Estrategias de Adopción

Roles en Vertex AI y su integración con Google Cloud

Flujo de Trabajo en Vertex AI: Integración y Despliegue de Modelos

Entrenamiento de Modelos de Visión con Google Cloud

Machine Learning APIs: Análisis Predictivo y Prescriptivo

Creación de Modelos Predictivos con AutoML en Google Cloud

Conclusiones del Curso de Big Data e Inteligencia Artificial

Proyecto: Clon de Google Photos (Parte 4 de 4)

Clonación de Infraestructura con Vision API y Base de Datos

Despliegue de Funciones en GCP con Vision API y Firestore

Implementación de Firestore y Vision API en Aplicaciones Cloud