Orquestación de Flujos Flexibles con Prefect y Python

Clase 22 de 35 • Curso de MLOPS: Despliegue de Modelos de Machine Learning

Contenido del curso

Fundamentos de MLOps y tracking de modelos

Tracking del ciclo de vida de modelos de machine learning

Orquestación de pipelines de machine learning

Despliegue de modelo de machine learning

Monitoreo de modelo de machine learning en producción

Tomar examen

Resumen

Diseñar flujos de trabajo robustos es una de las habilidades más valiosas en MLOps. La diferencia entre un proyecto que se recupera ante fallos y uno que obliga a repetir todo desde cero radica en cómo se orquestan sus etapas. A continuación se explican las claves para construir pipelines flexibles, evitar cuellos de botella y aprovechar herramientas como Prefect para gestionar tasks y flows de forma eficiente.

¿Por qué los flujos lineales representan un riesgo en MLOps?

Existe una máxima muy práctica: "piensa como si todo fuera a fallar todo el tiempo" [0:06]. Un flujo lineal típico puede incluir la adquisición de datos desde una base Postgres, su conversión a formato Parquet, la manipulación con Pandas, el procesamiento con scikit-learn, la construcción de un modelo XGBoost, el tracking con MLflow y la disponibilización del servicio con Flask [0:14]. El problema es claro: si cualquier paso intermedio falla, es necesario iterar desde el principio, lo que impacta directamente en rendimiento y tiempo.

¿Cómo se estructura un flujo flexible?

Un flujo flexible separa la lógica en bloques independientes [1:02]:

Identificación del problema: definir el caso de negocio, las variables a analizar y las métricas a optimizar.
Preparación de datos: colección, procesamiento, análisis, extracción de características y, cuando sea necesario, data augmentation.
Modelado y evaluación: selección del modelo, validación de hiperparámetros, entrenamiento, análisis de errores y almacenamiento del modelo para producción.

Al estar separadas, cada etapa funciona de manera autónoma. Si ocurre un error —por ejemplo, durante el entrenamiento [2:10]— basta con reanudar desde el punto exacto donde se detuvo, sin necesidad de volver al inicio. Esto se traduce en ahorro de recursos en la nube y de tiempo, dos variables críticas en cualquier operación productiva.

¿Qué papel juegan las tasks y los flows en Prefect?

Hasta este punto del aprendizaje se han cubierto conceptos fundamentales [2:30]:

Uso de tasks (tareas individuales que encapsulan una acción concreta).
Creación de flows (flujos que agrupan y coordinan varias tasks).
Ejecución de flujos a través del servidor de Prefect.

La orquestación con Prefect permite diferenciar cada paso del pipeline, de modo que un fallo en una task no comprometa el resto del flujo. Esto es precisamente lo que convierte a un flujo en flexible frente a uno lineal.

¿Cuáles son las mejores prácticas para orquestar flujos de MLOps?

Tres recomendaciones concretas para construir pipelines sólidos [2:44]:

Prefiere flujos flexibles sobre lineales. Separa las etapas con lógica diferenciada para que cada bloque pueda ejecutarse, fallar y recuperarse de forma independiente.
Una tarea, una responsabilidad. Evita que una sola task ejecute demasiadas operaciones. Cuando cada tarea resuelve una acción específica, identificar errores es más rápido y el refactoring se simplifica. El entry point —es decir, el script de Python asociado— queda localizado y fácil de corregir [3:04].
Documenta todos tus flujos de trabajo. La documentación garantiza trazabilidad: cualquier miembro del equipo puede entender qué se está haciendo y tomar decisiones informadas con base en lo que ya existe [3:22].

¿Cómo aplicar la trazabilidad en equipos de trabajo?

La trazabilidad no es solo un requisito técnico; es una ventaja colaborativa. Cuando los flujos están documentados, el conocimiento no depende de una sola persona. Si un compañero necesita intervenir un pipeline o evaluar si conviene modificar un modelo, la documentación le permite actuar con certeza y velocidad. Esto es especialmente relevante en entornos productivos donde las decisiones deben tomarse con agilidad.

Si ya estás trabajando con Prefect y quieres optimizar tus pipelines, prueba aplicar estas recomendaciones en tu próximo proyecto y comparte tu experiencia con tu equipo.

Orquestación de Flujos Flexibles con Prefect y Python

Fundamentos de MLOps y tracking de modelos

Implementación de MLOps para Modelos de Machine Learning

Principios y Etapas del MLOps en Machine Learning

Componentes de Infraestructura en MLOps: Control, Integración y Monitorización

Tracking de Modelos de Machine Learning con MLflow Local

Seguimiento local de experimentos con MLflow usando folder personalizado

Tracking de Experimentos con MLflow y Bucket en SQLite

Tracking de Experimentos de Machine Learning con AWS y MLflow

Tracking del ciclo de vida de modelos de machine learning

Clasificación de Tickets con Procesamiento de Lenguaje Natural

Tracking de Datos y Modelado con MNLflow y Scikit-learn

Tracking de Métricas e Hiperparámetros con Validación Cruzada

Tracking de Modelos y Métricas con MLflow y CycleLearn

Optimización de Hiperparámetros en Modelos de Machine Learning

Creación y gestión de experimentos con MLflow y Scikit-Learn

Promoción y Gestión de Modelos en Azure con MLflow

Validación de Modelos de Machine Learning con MLflow y SciPy

Tracking y Trazabilidad en MLOps con MLflow

Orquestación de pipelines de machine learning

Creación de tareas en Prefect para flujos de Machine Learning

Creación de Flujos de Trabajo con Prefect para Machine Learning

Pipeline de Machine Learning para Clasificación de Tickets

Pipeline de Procesamiento y Entrenamiento de Modelos de Datos

Ejecución de Flujos de Trabajo con Prefect: Conceptos y Prácticas