Despliegue Local y en AWS de Aplicaciones con Docker y Postman

Clase 27 de 35 • Curso de MLOPS: Despliegue de Modelos de Machine Learning

Contenido del curso

Fundamentos de MLOps y tracking de modelos

Tracking del ciclo de vida de modelos de machine learning

Orquestación de pipelines de machine learning

Despliegue de modelo de machine learning

Monitoreo de modelo de machine learning en producción

Tomar examen

Resumen

Configurar correctamente la estructura de un repositorio, construir imágenes Docker y validar predicciones de un modelo de machine learning con Postman son pasos fundamentales antes de llevar cualquier aplicación a un entorno productivo. Aquí se detalla cada parte del proceso, desde la organización de archivos hasta la consulta de resultados almacenados en una base de datos PostgreSQL.

¿Cómo debe estar estructurado el repositorio para el despliegue?

Antes de ejecutar cualquier comando, es clave tener una rama específica de deploy en el repositorio. Esto evita confusiones y garantiza que solo los archivos necesarios lleguen al servidor. Dentro del directorio App deben existir los siguientes elementos [01:00]:

__init__.py: archivo vacío que marca el directorio como paquete Python.
config: contiene la configuración general de la aplicación.
conductorizer.pickle: el artefacto serializado que transforma datos en una representación matricial numérica para que el modelo los reciba como features y ejecute el método .predict().
db: módulo con la configuración de la base de datos, incluyendo campos, tipado y la llave primaria (en este caso, el ID).
main: encapsula toda la lógica de la aplicación y el entry point.
prestart.sh: script que inicializa la base de datos en el puerto 5432, ya definido en el Docker Compose [01:52].
utils: módulo con funciones de procesamiento y transformación de datos.

Fuera de App se requieren archivos complementarios: el Docker Compose, el Dockerfile, el archivo mobile que se lee al hacer el entry point para generar predicciones bajo serving batch, el archivo de requerimientos con todas las dependencias, y un archivo de configuración para la instancia en AWS [02:28].

Este último archivo permite configurar el servidor remoto: actualizar paquetes con apt, establecer conexiones SSH y asignar llaves para que la instancia pueda clonar el repositorio de trabajo.

¿Cómo construir y levantar la aplicación con Docker de forma local?

Una vez verificada la rama correcta en la terminal, se ejecutan dos comandos esenciales [04:02]:

docker compose build: descarga las dependencias del Dockerfile y copia el directorio de trabajo.
docker compose up: levanta la imagen construida.

Durante este proceso puede aparecer un error de indentación en algún archivo como db.py. La solución es corregir la indentación, guardar el archivo y volver a construir la imagen [04:30]. En Windows, una buena práctica es ejecutar docker compose down o un shutdown antes de reconstruir, para asegurar que no queden contenedores en ejecución.

¿Qué hacer si aparecen errores al levantar el contenedor?

El flujo de corrección es directo: identificar el archivo y la línea señalados en el error, corregir el código, guardar antes de reconstruir y ejecutar nuevamente docker compose build seguido de docker compose up [05:12].

¿Cómo probar las predicciones con Postman?

Para validar que todo funciona se utiliza Postman como cliente HTTP [05:42]. La configuración del request incluye:

Método: POST, ya que se envía información al servidor.
URL del entry point: compuesta por la dirección IP local, el puerto 5004 y la ruta /predict.

Una dirección IP identifica un dispositivo en la red, pero además se necesita especificar el puerto por el cual se transmiten los datos [06:00].

¿Qué estructura debe tener el cuerpo del request?

El body sigue la estructura definida en el main mediante la clase Sentence [06:30]:

sentence: una lista que contiene diccionarios.
Cada diccionario representa un input con dos campos: client_name (nombre del cliente) y text (descripción del problema o ticket).

Al trabajar con serving batch, se envían múltiples diccionarios en una sola petición, lo que permite clasificar varios tickets simultáneamente. El objetivo del modelo es clasificar tickets de soporte para que las empresas ofrezcan atención más específica según la categoría: préstamos, hipotecas, productos bancarios, entre otros [07:10].

Al presionar Send, la respuesta retorna un diccionario con la clave prediction que contiene una lista de diccionarios, cada uno con el nombre del cliente y su predicción ya decodificada [07:55]. Esto ocurre gracias al label mapping definido en el main, que convierte las predicciones numéricas del modelo en etiquetas legibles.

Un status code 200 confirma que la petición fue exitosa y los resultados se almacenaron automáticamente en la base de datos.

¿Cómo verificar los datos almacenados en PostgreSQL?

Para consultar la base de datos se puede usar cualquier gestor, como la extensión Connections de Visual Studio Code [08:35]. La conexión requiere:

Host: localhost.
Puerto: 5433.
Usuario, contraseña y nombre de la base de datos definidos en el archivo Docker.

Al conectar, se visualizan los registros con tres columnas: el ID como llave primaria de tipo integer, el nombre del cliente y la predicción clasificada. En las pruebas realizadas se almacenaron aproximadamente 1300 registros [09:10].

¿Ya lograste levantar tu aplicación de forma local? Comparte tu experiencia o dudas en los comentarios.

Comentarios

Pold Anampa Saravia

student•

por que clasifica todo comomortage/loan??

logre generar un input pero tbn tengo el mismo inconveniente, lo revisare

Ignacio Milesi

student•

Parece que el model y el count_vectorizer que estan subidos al repositorio estan mal seteado.

Si los uso, clasifica todo como "mortage/loan", pero si los cambio por otro model y otro count_vectorizer, que genere en las clases anteriores, si clasifica bien los input

Cristian Omar Rubio Ceja

student•

una duda, por que usar postman cuando se puede utilizar el mismo docs de FastAPI?

Emilio Sala

student•

supongo que es por la reproducibilidad

Santiago Ballesteros

student•

El archivo que usaste en postman donde lo puedo encontrar, no lo encontre en el repositorio?

María Camila Durango Barrera

teacher•

Story time: tuve que resetear unas cosas del pc y lo perdí, pero lo generé con un prompt, podrías usar chatgtp para generarlos!

Noemi González Lois

student•

¿Puedes mostrar cuál es la extensión que utilizas para hacer la consulta a la DB desde VSCode?

María Camila Durango Barrera

teacher•

La extensión es Database Client :)

Noemi González Lois

student•

¿Dónde está el archivo con los input? No está en la carpeta de recursos ni en el repositorio de Github

María Camila Durango Barrera

teacher•

Las he generado con ChatGTP, puedes hacerte un prompt, sin embargo, en los recursos vamos podríamos añadir algunos inputs (me lo llevo) :)

JULIO ALFONSO MESA PÉREZ

student•

En caso de que al levantar el servicio con docker-compose up salga el error:

sqlalchemy.exc.OperationalError: (psycopg2.OperationalError) SCRAM authentication requires libpq version 10 or above,

Cambiar dentro del archivo requirementes.txt, la versión de instalación a psycopg2-binary>=2.9.5. para que instale una versión superior.

Luego volver a compilar y levantar el servicio en la terminal, con docker-compose build y docker-compose up.

Despliegue Local y en AWS de Aplicaciones con Docker y Postman

Fundamentos de MLOps y tracking de modelos

Implementación de MLOps para Modelos de Machine Learning

Principios y Etapas del MLOps en Machine Learning

Componentes de Infraestructura en MLOps: Control, Integración y Monitorización

Tracking de Modelos de Machine Learning con MLflow Local

Seguimiento local de experimentos con MLflow usando folder personalizado

Tracking de Experimentos con MLflow y Bucket en SQLite

Tracking de Experimentos de Machine Learning con AWS y MLflow

Tracking del ciclo de vida de modelos de machine learning

Clasificación de Tickets con Procesamiento de Lenguaje Natural

Tracking de Datos y Modelado con MNLflow y Scikit-learn

Tracking de Métricas e Hiperparámetros con Validación Cruzada

Tracking de Modelos y Métricas con MLflow y CycleLearn

Optimización de Hiperparámetros en Modelos de Machine Learning

Creación y gestión de experimentos con MLflow y Scikit-Learn

Promoción y Gestión de Modelos en Azure con MLflow

Validación de Modelos de Machine Learning con MLflow y SciPy

Tracking y Trazabilidad en MLOps con MLflow

Orquestación de pipelines de machine learning

Creación de tareas en Prefect para flujos de Machine Learning

Creación de Flujos de Trabajo con Prefect para Machine Learning

Pipeline de Machine Learning para Clasificación de Tickets

Pipeline de Procesamiento y Entrenamiento de Modelos de Datos

Ejecución de Flujos de Trabajo con Prefect: Conceptos y Prácticas

Orquestación de Flujos Flexibles con Prefect y Python

Despliegue de modelo de machine learning

Despliegue de Aplicaciones con Docker y FAS API en AWS

Creación de Aplicación con PaaS API, Docker y Grafana

Preprocesamiento y Predicción de Texto en Modelos de Machine Learning

Configuración de Base de Datos en SQLModel y Docker Compose

Despliegue Local y en AWS de Aplicaciones con Docker y Postman

Implementación de Modelos en Entornos Productivos con AWS y Docker

Autoescalado y Entrega Continua de Modelos en Producción

Monitoreo de modelo de machine learning en producción

Monitoreo de Modelos en Producción: Estrategias y Métricas Clave

Monitoreo de Modelos en Producción: Calidad de Datos y Data Drift

Modelo de Clasificación con Support Vector Classifier

Análisis de Drift y Valores Faltantes con Evidently

Creación de Dashboards y Visualizaciones en Grafana para Machine Learning

Mejora de Procesos MLOps e Infraestructura Escalable