Roles en Vertex AI y su integración con Google Cloud

Clase 11 de 19 • Curso de Big Data y Machine Learning con Google Cloud Platform

Contenido del curso

Manejo de Big Data

Herramientas de inteligencia artificial

Proyecto: Clon de Google Photos (Parte 4 de 4)

Resumen

Construir modelos de machine learning en producción requiere mucho más que algoritmos: exige coordinar equipos, servicios en la nube y prácticas de gobierno responsable. Vertex AI es la plataforma de Google Cloud que unifica todo el ciclo de vida de un modelo, desde la ingesta de datos hasta su despliegue y monitoreo continuo. A continuación, se explican los roles involucrados, los servicios clave y los principios que garantizan transparencia y confianza.

¿Qué roles interactúan con los servicios de Google Cloud?

Cada perfil dentro de un equipo de datos cumple una función específica y se apoya en distintos servicios de la plataforma.

¿Qué hace un product manager en el ecosistema de datos?

El Product Manager es quien posee el conocimiento de los insights y los objetivos del proyecto [0:14]. Necesita acceso rápido a la información, por lo que trabaja con herramientas de visualización ágil y hojas de cálculo que le permitan construir sus propias métricas y reportes de forma flexible.

¿Cómo contribuyen el data analyst y el data engineer?

El Data Analyst realiza consultas a los datos buscando patrones, tendencias y estadísticas descriptivas [0:42]. Interactúa con servicios como BigQuery, Data Fusion, Dataflow, Looker para visualización, el catálogo de datos y BigQuery ML para modelos directos en SQL.

Por su parte, el Data Engineer es fundamental para construir pipelines de datos limpios y útiles en la creación de modelos predictivos [1:06]. Trabaja con BigQuery, Dataflow, Composer y Dataproc, y accede a herramientas de calidad y linaje de datos. Cuando se requiere procesamiento en tiempo real, utiliza BigQuery y Dataflow en conjunto.

¿Cuál es la diferencia entre data scientist, ML developer y ML engineer?

Data Scientist: construye modelos usando Jupyter Notebooks, TensorFlow, servicios de Auto Machine Learning, el feature store y los pipelines de datos de Vertex AI [1:42].
ML Developer: integra las aplicaciones de la compañía con los modelos de machine learning, trabajando con servicios de conversación, lenguaje natural, video y optimización [2:06].
ML Engineer: une el trabajo del data scientist y el data engineer para llevar los modelos a producción [2:24]. Se encarga de la escalabilidad, aplica metodologías de integración y delivery continuo (CI/CD), y monitorea métricas de evaluación continua para detectar cuándo es necesario un reentrenamiento del modelo.

¿Qué ofrece Vertex AI dentro del ecosistema de Google Cloud?

Dentro de la oferta de inteligencia artificial de Google Cloud existen soluciones como Document AI, Recommendation AI y Contact Center AI [2:58]. Vertex AI, en cambio, agrupa las APIs preentrenadas y los algoritmos de machine learning que se pueden personalizar para cada caso de uso.

La plataforma se organiza en torno a tres ejes [3:28]:

Construir modelos de la mejor forma posible.
Acelerar el desarrollo para reducir tiempos de entrega.
Mejorar la confianza trabajando con responsabilidad sobre los datos.

Como resultado, Vertex AI entrega cuatro beneficios concretos [3:52]:

Velocidad para llevar modelos a producción.
Acceso a los mejores modelos disponibles en Google Cloud.
Flujos de trabajo escalables para datos batch o en tiempo real.
Gestión integral y gobierno del ciclo de vida del modelo.

¿Cómo se construyen pipelines automatizados con MLOps?

El flujo de trabajo unificado abarca análisis de información, transformación de datos, entrenamiento, seguimiento, evaluación y despliegue [4:20]. Vertex Pipelines permite automatizar cada etapa bajo la metodología de MLOps [5:08]: extraer datos, validarlos, prepararlos, entrenar el modelo, evaluarlo y desplegarlo.

Los servicios que soportan este flujo incluyen:

BigQuery como repositorio de datos.
Entrenamiento serverless en Vertex AI.
Dataflow para procesamiento.
Predicción con Vertex AI.
Cloud Storage para almacenar artefactos del modelo.

¿Por qué importan la transparencia y la responsabilidad?

El gobierno del ciclo de vida se sustenta en tres pilares [5:50]:

Transparencia: documentar las variables que intervienen en el modelo y las razones detrás de cada decisión.
Confianza del usuario: asegurar la calidad de datos, registrar las transformaciones y mantener trazabilidad completa.
Responsabilidad: Google Cloud establece principios de inteligencia artificial que definen límites éticos y apoyan un desarrollo responsable [6:38].

Si quieres profundizar en cómo estos roles y servicios se conectan en la práctica, comparte en los comentarios qué rol desempeñas y qué servicio de Vertex AI te resulta más relevante.

Comentarios

Eduardo Reyes

student•

Den una pasada en este video para reforzar: https://www.youtube.com/watch?v=gT4qqHMiEpA

nicolas pozzi

student•

Product manager -Bi interactivo -EDW en Spreadsheet -Consultas en lenguaje natural

Data analyst -Data warehouse interminable -Data pipelines autogestionados -Modelo de datos catálogo -Machine Learning en SQL

Data engineer -Infraestructura autónoma -Variedad de herramientas/lenguajes -Calidad/linaje de datos -Capacidades en tiempo real

Data scientist -Notebooks portables -Evaluación y selección de modelos -Desarrollo point anda click -Colaboración

ML developer -Imagenes y videos -Análisis de sentimiento extracción de entidades -Chatbots, comandos de voz -Enrutamiento de flotas previsión

ML engineer -Alojamiento de modelos escalables -ML CI/CD y orquestación -Procedencia y linaje -Mejoras y reentrenamiento

Vertex Ai -Construye en lo mejor -Acelera tiempo a valor -Confianza y responsabilidad _Obtenemos: _ -Velocidad en los modelos de producción -Los mejores algoritmos como servicio de Google -Flujo de trabajo de ML -Gestión y gobierno de modelos

Jeffersson Muñoz Torres

student•

Gran clase! Fue una presentación a alto nivel de todo lo que engloban los datos y ML 🤯

Efrain Montealegre Raga

student•

Una generalización muy importante de todo el flujo de trabajo! Es demasiado importante para el crecimiento en el manejo de la plataforma.

Jhon Freddy Tavera Blandon

student•

. Preprocesamiento de Datos:

Conexión con Servicios de Almacenamiento: Vertex AI se integra con servicios de almacenamiento de GCP como Cloud Storage para acceder a conjuntos de datos y almacenar modelos entrenados.

Preparación de Datos: Permite realizar transformaciones y limpieza de datos utilizando herramientas como Dataflow, BigQuery u otros servicios de procesamiento de datos.

2. Desarrollo de Modelos:

AutoML y Custom Training: Ofrece capacidades de AutoML para entrenar modelos automáticamente a partir de datos etiquetados, así como la opción de entrenamiento personalizado con TensorFlow, PyTorch u otras bibliotecas de ML.
Búsqueda de Hiperparámetros: Ayuda a optimizar los hiperparámetros de los modelos para mejorar el rendimiento y la precisión.

3. Implementación y Despliegue:

Despliegue de Modelos: Permite desplegar modelos entrenados como servicios API para realizar predicciones en tiempo real o en lotes.
Escalabilidad Automática: Vertex AI escala automáticamente los recursos de cómputo según la carga de trabajo y la demanda de predicciones.

4. Monitoreo y Evaluación:

Monitoreo de Modelos en Producción: Proporciona métricas de rendimiento, seguimiento de versiones de modelos y alertas para detectar desviaciones en el rendimiento de los modelos en producción.
Análisis de Sesgo y Equidad: Ayuda a identificar y mitigar sesgos en los datos y modelos para garantizar la equidad y la imparcialidad.

5. Optimización Continua:

Optimización de Modelos: Ofrece herramientas y técnicas para mejorar continuamente la precisión y eficiencia de los modelos, como la optimización de inferencias y el ajuste dinámico de recursos.

6. Herramientas Integradas:

Vertex Pipelines: Permite la creación y gestión de pipelines de ML para automatizar flujos de trabajo de entrenamiento, evaluación y despliegue de modelos.
Vertex Feature Store: Proporciona un repositorio centralizado para gestionar y compartir características de datos utilizadas en modelos de ML.

Marcelo Gimenez Suarez

student•

He estado viendo los cursos de Google Cloud Platform y son demasiados teóricos para mi gusto. La teoría esta bien y siempre es bueno tenerla presente, pero deberían incorporar más ejemplos prácticos de lo que se puede hacer con cada servicio, porque en definitiva el fin último de aprender esto, es llevar el conocimiento a la práctica, que es realmente lo que necesitan las empresas.

julio donadello

student•

no me aporta info.

Dave Sanchfor

student•

Esta clase estuvo genail, abordo todo el flujo vertex de una forma clara y entendible.

me encanto!

Roles en Vertex AI y su integración con Google Cloud

Manejo de Big Data

Big Data y Machine Learning en Google Cloud Platform

Google Cloud y Big Data: Historia, Servicios y Aplicaciones Prácticas

Google Cloud Platform para Big Data: Arquitectura y Seguridad

Exploración de Servicios Big Data e IA en Google Cloud

Procesamiento de Datos con Cloud Dataflow en Google Cloud

Características y Funcionalidades de BigQuery

Integración de BigQuery con Data Studio: Creación de Dashboards

Funcionamiento de PubSub en Google Cloud y su Integración con Dataflow

Integración de PubSub, Dataflow y BigQuery en Google Cloud

Herramientas de inteligencia artificial

Aplicación de Machine Learning en Industrias y Estrategias de Adopción

Roles en Vertex AI y su integración con Google Cloud

Flujo de Trabajo en Vertex AI: Integración y Despliegue de Modelos

Entrenamiento de Modelos de Visión con Google Cloud

Machine Learning APIs: Análisis Predictivo y Prescriptivo

Creación de Modelos Predictivos con AutoML en Google Cloud

Conclusiones del Curso de Big Data e Inteligencia Artificial

Proyecto: Clon de Google Photos (Parte 4 de 4)

Clonación de Infraestructura con Vision API y Base de Datos

Despliegue de Funciones en GCP con Vision API y Firestore

Implementación de Firestore y Vision API en Aplicaciones Cloud