Testar modelos MLflow em produção

Curso de MLOPS: Despliegue de Modelos de Machine Learning

Contenido del curso

Fundamentos de MLOps y tracking de modelos

Tracking del ciclo de vida de modelos de machine learning

Orquestación de pipelines de machine learning

Despliegue de modelo de machine learning

Monitoreo de modelo de machine learning en producción

Tomar examen

Testar modelos MLflow em produção

Resumen

Llevar un modelo de machine learning a producción no termina cuando lo registras: necesitas validarlo con un conjunto de pruebas para confirmar que responde como esperas. Aquí aprenderás a cargar un modelo desde MLflow usando su stage de producción y a medir su desempeño con datos de prueba, además de entender qué ventajas y límites tiene esta herramienta frente a alternativas como Weights & Biases o DVC.

¿Cómo defines una función para probar un modelo desde MLflow?

La idea es construir una función reutilizable que reciba el nombre del modelo, el stage y el conjunto de prueba, y devuelva la métrica de desempeño.

Antes de escribirla, importa scipy. Esto te permitirá tipar correctamente el X_test como matriz dispersa, algo común cuando trabajas con vectorización de texto. Tipar las variables y mantener el docstring es buena práctica porque deja claro qué espera y qué retorna cada función.

La función test_model_from_mlflow recibe estos parámetros:

model_name: el nombre con el que registraste el modelo, en este caso ticket_classifier.
stage: el estado del modelo, que aquí será Production.
X_test: la matriz dispersa con los datos de prueba.
y_test: las etiquetas verdaderas para comparar contra las predicciones.

Dentro de la función defines un model_uri con el formato models:/<model_name>/<stage>. Ese URI le indica a MLflow exactamente qué versión cargar. Luego usas mlflow.pyfunc.load_model(model_uri) para traer el modelo, generas las predicciones sobre X_test y devuelves el accuracy_score comparándolas con y_test.

¿Qué es el model_uri en MLflow? Es la ruta que apunta a un modelo registrado siguiendo el formato models:/nombre_modelo/stage. Sirve para cargar la versión exacta que necesitas sin depender de rutas locales.

¿Por qué usar el stage de producción al evaluar?

Usar el stage de producción asegura que estás probando el mismo modelo que se está sirviendo a usuarios finales, no una versión experimental.

Cuando ejecutas la función con model_name="ticket_classifier", stage="Production" y los conjuntos X_test y y_test, obtienes la métrica real sobre datos no vistos. Ese número es el que te dice si el modelo está listo para seguir en producción o si necesita ajustes.

Hasta este punto, con MLflow ya puedes hacer varias cosas que antes resolvías a mano:

Llevar registro de tus experimentos sin depender de hojas de Excel.
Saber qué hiperparámetros dieron los mejores resultados.
Guardar metadatos como artefactos junto al modelo.
Reentrenar partiendo de configuraciones probadas, no de valores aleatorios.

¿Cuáles son las ventajas y desventajas reales de MLflow?

MLflow gestiona el ciclo de vida completo de tus modelos, pero tiene puntos fuertes y limitaciones que conviene conocer antes de adoptarlo en equipos grandes.

Ventajas que destacan en el flujo diario

Seguimiento de experimentos: registras hiperparámetros, métricas y artefactos en cada corrida.
Interoperabilidad: se integra con Scikit-Learn, Hugging Face, TensorFlow y PyTorch.
Trazabilidad y reproducibilidad: replicas un experimento partiendo de los mejores hiperparámetros guardados.
Comunidad activa: encuentras soluciones rápido cuando aparecen dudas o errores.

Desventajas que debes considerar

Curva de aprendizaje: tiene muchos métodos y cambian entre versiones, así que conviene fijar la versión que usas.
Limitaciones con grandes volúmenes: ciertos flujos de trabajo se quedan cortos cuando manejas información a gran escala.

¿Qué alternativas existen a MLflow? TensorBoard para visualización, DVC (Data Version Control) para versionar datos y modelos, y Weights & Biases para tracking de experimentos, tags y flujos de trabajo colaborativos.

La elección depende del tamaño de tu equipo, del volumen de datos y de qué tan profundo quieras integrar el seguimiento con tu stack actual. ¿Cuál de estas herramientas usas tú hoy y qué te gustaría que mejorara?

Alberto Duque Villegas

Estudiante

### En esta lección, los bloques de código explicados por María Camila, en "Sometamos a prueba el modelo que hemos registrado para producción", permiten:

1. **Definir una función para probar un modelo de MLflow**: se crea una función que permite cargar un modelo registrado en MLflow, basándose en su nombre y etapa, y luego poder realizar predicciones sobre un conjunto de datos de prueba. Finalmente, calcula y devuelve una métrica de precisión redondeada.

1.1 **Construcción de la URI del modelo**: se construye una URI que apunta al modelo en MLflow usando su nombre y etapa (en este caso, "Producción").

1.2 **Cargar el modelo**: el modelo se carga desde MLflow utilizando la URI especificada.

1.3 **Hacer predicciones**: se realiza una predicción sobre los datos de prueba (X\_test), utilizando el modelo cargado.

1.4 **Calcular precisión**: se calcula la métrica de precisión (accuracy\_score) comparando las predicciones con los valores reales (Y\_test), redondeando el valor.

2. **Probar el modelo**: se llama a la función para probar el modelo registrado como "tickets_classifiers" en la etapa de producción, con los datos de prueba correspondientes. El tiempo de ejecución se mide con %time.

### En resumen:

Este conjunto de bloques permite probar un modelo cargado desde MLflow en la etapa de "Producción" sobre un conjunto de datos de prueba, evaluando su precisión. Es útil para validar el rendimiento de modelos en producción.

---

Con esta estructura, se refleja mejor la lógica interna y se organiza de manera más clara. ¿Qué opinas de esta versión?

Platzi

Estudiante

La transcripción muestra cómo realizar pruebas a modelos de MLflow en producción, explicando el proceso de carga del modelo, predicción y cálculo de precisión; junto con detalles de MLflow como la gestión de ciclo de vida, interoperabilidad y trazabilidad.

José Salas Bolívar

Estudiante

Gracias!!!

Testar modelos MLflow em produção

Fundamentos de MLOps y tracking de modelos

MLOps para llevar modelos a producción

Principios y Etapas del MLOps en Machine Learning

Componentes de Infraestructura en MLOps: Control, Integración y Monitorización

Tracking de Modelos de Machine Learning con MLflow Local

Seguimiento local de experimentos con MLflow usando folder personalizado

MLflow com backend SQLite local

Tracking de Experimentos de Machine Learning con AWS y MLflow

Tracking del ciclo de vida de modelos de machine learning

Clasificación de Tickets con Procesamiento de Lenguaje Natural

Tracking de Datos y Modelado con MNLflow y Scikit-learn

Métricas e hiperparámetros con MLflow

Tracking de Modelos y Métricas con MLflow y CycleLearn

Optimización de Hiperparámetros en Modelos de Machine Learning

Creación y gestión de experimentos con MLflow y Scikit-Learn

Cómo promover modelos MLflow a producción