- 1

Implementación de MLOps para Modelos de Machine Learning
02:10 - 2

Principios y Etapas del MLOps en Machine Learning
09:21 - 3

Componentes de Infraestructura en MLOps: Control, Integración y Monitorización
08:23 - 4

Tracking de Modelos de Machine Learning con MLflow Local
12:48 - 5

Seguimiento local de experimentos con MLflow usando folder personalizado
04:53 - 6

Tracking de Experimentos con MLflow y Bucket en SQLite
04:04 - 7

Tracking de Experimentos de Machine Learning con AWS y MLflow
09:11
Tracking y Trazabilidad en MLOps con MLflow
Clase 16 de 35 • Curso de MLOPS: Despliegue de Modelos de Machine Learning
Contenido del curso
- 8

Clasificación de Tickets con Procesamiento de Lenguaje Natural
10:41 - 9

Tracking de Datos y Modelado con MNLflow y Scikit-learn
10:30 - 10

Tracking de Métricas e Hiperparámetros con Validación Cruzada
07:19 - 11

Tracking de Modelos y Métricas con MLflow y CycleLearn
08:53 - 12

Optimización de Hiperparámetros en Modelos de Machine Learning
12:17 - 13

Creación y gestión de experimentos con MLflow y Scikit-Learn
10:29 - 14

Promoción y Gestión de Modelos en Azure con MLflow
09:05 - 15

Validación de Modelos de Machine Learning con MLflow y SciPy
05:15 - 16

Tracking y Trazabilidad en MLOps con MLflow
07:41
- 17

Creación de tareas en Prefect para flujos de Machine Learning
08:49 - 18

Creación de Flujos de Trabajo con Prefect para Machine Learning
08:58 - 19

Pipeline de Machine Learning para Clasificación de Tickets
11:55 - 20

Pipeline de Procesamiento y Entrenamiento de Modelos de Datos
09:57 - 21

Ejecución de Flujos de Trabajo con Prefect: Conceptos y Prácticas
04:55 - 22

Orquestación de Flujos Flexibles con Prefect y Python
04:51
- 23

Despliegue de Aplicaciones con Docker y FAS API en AWS
08:01 - 24

Creación de Aplicación con PaaS API, Docker y Grafana
06:39 - 25

Preprocesamiento y Predicción de Texto en Modelos de Machine Learning
10:02 - 26

Configuración de Base de Datos en SQLModel y Docker Compose
05:28 - 27

Despliegue Local y en AWS de Aplicaciones con Docker y Postman
13:37 - 28

Implementación de Modelos en Entornos Productivos con AWS y Docker
12:53 - 29

Autoescalado y Entrega Continua de Modelos en Producción
02:31
- 30

Monitoreo de Modelos en Producción: Estrategias y Métricas Clave
11:48 - 31

Monitoreo de Modelos en Producción: Calidad de Datos y Data Drift
20:53 - 32

Modelo de Clasificación con Support Vector Classifier
13:23 - 33

Análisis de Drift y Valores Faltantes con Evidently
12:25 - 34

Creación de Dashboards y Visualizaciones en Grafana para Machine Learning
07:05 - 35

Mejora de Procesos MLOps e Infraestructura Escalable
02:48
¿Por qué es importante el tracking en un flujo de MLOps?
El seguimiento o tracking es esencial en cada etapa de un flujo de MLOps porque nos asegura la trazabilidad y replicabilidad de los procesos. Desde la preparación de los datos, pasando por la creación del modelo, hasta la disponibilización de este, el seguimiento nos garantiza que estamos utilizando los datos y versiones correctas. Esto nos permite tener un control detallado sobre qué datos y qué versiones han sido empleadas, y cómo han sido transformadas a lo largo de todo el desarrollo y experimentación de nuestros modelos.
¿Cómo influye el seguimiento en la preparación de datos?
- Adquisición y limpieza: Se trata de obtener y limpiar datos, garantizando la calidad desde el comienzo.
- Ingesta y transformación: Aquí los datos se analizan y transforman para hacer posible su validación con pruebas unitarias, asegurando la integridad y consistencia de los tipos y contenidos.
- Feature engineering: Consiste en seleccionar o crear características adecuadas que permiten dividir correctamente los datos en conjuntos de entrenamiento, prueba y validación.
Hacer tracking en estas subetapas del proceso asegura que cada transformación y modificación esté correctamente registrada y versionada. Esto se traduce en confianza al momento de los entrenamientos y pruebas con los modelos, ya que se tiene total claridad sobre qué información se está manejando.
¿Cuál es la relevancia del tracking durante la creación del modelo?
- Versionado del modelo y artefactos: Se asignan versiones a cada elemento, dando claridad sobre qué modelo ha sido optimizado y validado para la producción.
- Optimización y validación cruzada: Iterar entre diferentes configuraciones garantiza que se tenga el modelo más eficiente y robusto.
- Registro de modelos: Asignar estándares y registros a los modelos permite su manipulación y despliegue en diferentes entornos.
Establecer un buen sistema de tracking en esta etapa significa tener la capacidad de reproducir resultados y medir el rendimiento de distintas versiones del modelo. Facilita también la manipulación eficiente de estos modelos en los repositorios, asegurando que formen parte de los flujos de producción y desarrollo de forma armoniosa.
¿Cómo puede MLflow ayudar en el tracking?
MLflow es una herramienta que potencia el tracking a niveles óptimos. Automatiza y simplifica muchos aspectos cruciales, integrándose fácilmente con otros sistemas conocidos como TensorFlow, PyTorch y Scikit-Learn. MLflow es ventajoso por las siguientes razones:
- Despliegue de modelos: Permite gestionar y desplegar modelos en diferentes ambientes con facilidad.
- Almacenamiento de metadata: Guarda información esencial que abarca desde requerimientos específicos, hiperparámetros, hasta la versión de código y datos.
- Proyecto y experimentación: Facilita empaquetar y replicar el código fuente, garantizando que los experimentos sean replicables y adaptables en cualquier momento.
- Registro y estado de modelos: Impulsa la capacidad de asignar estados a los modelos, reconociendo su fase de desarrollo o producción para su manipulación eficaz en flujos de trabajo.
Al utilizar MLflow, los equipos de trabajo pueden coordinar de manera más efectiva. La claridad en la gestión de versiones y la posibilidad de automatizar procesos minimizan errores humanos y mejoran la eficiencia general.
¿Cuáles son las recomendaciones para un efectivo tracking en MLOps?
- Automatización de procesos: Centrarse en automatizar el diseño, desarrollo y operaciones maximiza la madurez del flujo y minimiza errores.
- Almacenamiento de metadata: Documentar todo lo relacionado con versiones de modelos y datos te ofrece un gran control operativo.
- Pruebas exhaustivas: Asegúrate de validar adecuadamente tanto los datos como las transformaciones. Esto asegura que las transformaciones implementadas son correctas y efectivas.
- Validación de infraestructura: Ten prevista la capacidad computacional necesaria con anticipación para optimizar tiempos de cómputo y rendimiento. Esto es crucial si se requiere aumentar memoria, procesadores o GPU para ejecutar los modelos de manera eficaz.
El seguimiento es vital para asegurar la calidad y consistencia de los procesos dentro del ámbito de MLOps. Implementar buenas prácticas de tracking facilita la colaboración entre equipos, garantizando resultados precisos y confiables en la industria del Machine Learning.