Fundamentos de MLOps y tracking de modelos

1

¿Qué es MLOps y para qué sirve?

2

Tracking de modelos en localhost con MLflow

3

Tracking de modelos en localhost: directorio personalizado

4

Etapas del ciclo de MLOps

5

Componentes de MLOps

6

Tracking de modelos con MLflow y SQLite

7

Tracking de modelos con MLflow en la nube

Tracking del ciclo de vida de modelos de machine learning

8

Tracking de experimentos con MLflow: preprocesamiento de datos

9

Tracking de experimentos con MLflow: definición de funciones

10

Tracking de experimentos con MLflow: tracking de métricas e hiperparámetros

11

Tracking de experimentos con MLflow: reporte de clasificación

12

Entrenamiento de modelos baseline y análisis en UI de MLflow

13

MLflow Model Registry: registro y uso de modelos

14

Registro de modelos con mlflow.client

15

Testing de modelo desde MLflow con datos de prueba

16

¿Para qué sirve el tracking de modelos en MLOps?

Orquestación de pipelines de machine learning

17

Tasks con Prefect

18

Flows con Prefect

19

Flow de modelo de clasificación de tickets: procesamiento de datos y features

20

Flow de modelo de clasificación de tickets: integración de las tasks

21

Flow de modelo de clasificación de tickets: ejecución de tasks

22

¿Cómo se integra la orquestación en MLOps?

Despliegue de modelo de machine learning

23

Despligue con Docker y FastAPI: configuración y requerimientos

24

Despligue con Docker y FastAPI: definición de clases y entry point

25

Despligue con Docker y FastAPI: procesamiento de predicciones en main app

26

Despligue con Docker y FastAPI: configuración de la base de datos

27

Despliegue y pruebas de modelo de machine learning en localhost

28

Despliegue y pruebas de modelo de machine learning en la nube

29

¿Qué hacer con el modelo desplegado?

Monitoreo de modelo de machine learning en producción

30

¿Cómo monitorear modelos de machine learning en producción?

31

Entrenamiento de modelo baseline

32

Preparar datos para crear reporte con Evidently

33

Análisis de la calidad de los datos con Evidently

34

Creación de reportes con Grafana

35

¿Cómo mejorar tus procesos de MLOps?

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Testing de modelo desde MLflow con datos de prueba

15/35
Recursos

¿Cómo realizar pruebas en un modelo de producción completo?

El desarrollo de un modelo de machine learning no termina con su entrenamiento; de hecho, es apenas el inicio. Una parte crucial es someter al modelo a pruebas exhaustivas para garantizar su desempeño en un entorno de producción. En este contexto, te guiaremos paso a paso para testear un modelo usando MLflow, valiéndose de herramientas como SciPy para especificar el tipo de variables de entrada y maximizar la eficiencia.

¿Cuáles son los elementos clave para realizar un test eficaz?

Para probar de manera efectiva un modelo, primero necesitas importar SciPy, ya que es esencial para especificar el tipo de las variables de entrada. Además, se definirá una función llamada testModelFromMlplot que te permitirá ejecutar la evaluación del modelo. Sus parámetros incluyen:

  • modelName: Nombre que asignaste al registrar el modelo, por ejemplo, TicketClassifier.
  • stage: Relacionado con un entorno de producción.
  • Xtest: Conjunto de pruebas.
  • Las etiquetas verdaderas correspondientes.

Este enfoque garantiza una estructura clara para la funcionalidad y tipo de datos esperados, lo que facilita su implementación y mantenimiento.

¿Cómo cargar y evaluar el modelo?

Con la función definida, necesitarás cargar el modelo desde un path específico, utilizando una variable denominada modelHybrid. Este path incluirá el modelName y el stage definido. Una vez cargado el modelo empleando PythoncLoadModel, procederás a predecir sobre el conjunto de prueba.

La evaluación del modelo se realiza almacenando las predicciones y calculando métricas como accuracy score, lo cual retorna resultados confiables sobre el desempeño del modelo.

¿Cuáles son las ventajas y desventajas de MLflow en este contexto?

Ventajas de MLflow

MLflow ofrece diversas funcionalidades que optimizan la gestión de modelos de machine learning. Algunas de estas ventajas incluyen:

  • Gestión del ciclo de vida: Permite un seguimiento trasparente de tus experimentos, documentando métricas e hiperparámetros que facilitarán futuras referencias.
  • Interoperabilidad: Se integra sin problemas con otras herramientas open source como Hugging Face, TensorFlow y PyTorch, facilitando una mayor diversidad de proyectos.
  • Trazabilidad y reproductibilidad: Oportunidad de replicar experimentos fácilmente usando los mejores hiperparámetros previos.
  • Comunidad activa: Beneficio de un soporte comunitario robusto para resolver dudas o problemas.

Desventajas de MLflow

A pesar de sus fortalezas, MLflow también tiene ciertas desventajas:

  • Curva de aprendizaje: Puede requerir tiempo aprender a utilizar los múltiples métodos y funciones que ofrece, especialmente porque varían entre versiones.
  • Limitaciones funcionales: Algunas operaciones pueden verse restringidas, especialmente cuando se manejan grandes volúmenes de información y datos.

Existen además alternativas a MLflow que podrías considerar, como Tension Board, DVC (Data Version Control), y una opción cada vez más popular, Weighted Biases, que también ofrece herramientas para el seguimiento de experimentos y flujos de trabajo.

Tu capacidad para aprovechar al máximo las herramientas disponibles marca la diferencia en la eficacia de un proyecto de machine learning. Sigue explorando estas opciones y nunca dejes de aprender, la evolución constante es clave en el mundo de la tecnología.

Aportes 0

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?