Creación de Aplicación con PaaS API, Docker y Grafana

Clase 24 de 35 • Curso de MLOPS: Despliegue de Modelos de Machine Learning

Resumen

¿Cómo crear una aplicación con procesamiento en batch y predicciones?

En el mundo del desarrollo de software, una de las habilidades más valiosas es la capacidad de construir aplicaciones robustas y eficientes. Aquí, nos enfocaremos en la creación de una aplicación que no solo maneja fácilmente múltiples entradas (gracias al procesamiento por batches), sino también genera predicciones utilizando un modelo preentrenado. Este tipo de soluciones son fundamentales, especialmente cuando se trabaja con grandes volúmenes de datos y se requiere un sistema de respuesta rápida.

¿Qué librerías y herramientas necesito importar?

Para comenzar, es necesario importar una serie de librerías y herramientas que permitirán el funcionamiento óptimo de la aplicación:

PaaS API: Essential para el despliegue y manejo de entry points.
Pydantic (BaseModel): Útil para estructurar los datos entrantes y definir esquemas para la base de datos.
Joblib: Para cargar modelos preentrenados.
Otras librerías: Proporcionan funciones de procesamiento y transformación de datos.

¿Cómo se define la estructura de los datos de entrada?

La arquitectura de la aplicación se basa en un modelo de entrada robusto que puede manejar múltiples solicitudes simultáneamente. Aquí, definimos clases para estructurar los datos que ingresarán al sistema:

from pydantic import BaseModel

class Sentence(BaseModel):
    client_name: str
    text: str

class ProcessTextRequestModel(BaseModel):
    sentences: list[Sentence]

Clase Sentence: Define las propiedades básicas de cada entrada, como el nombre del cliente y el texto asociado al ticket.
Clase ProcessTextRequestModel: Especifica que cada entrada puede contener múltiples sentencias, permitiendo un procesamiento simultáneo de datos.

¿Cómo implementar el entry point y procesamiento?

El encapsulamiento del punto de entrada es vital para ejecutar la lógica de negocio subyacente. Implementar un método asincrónico para gestionar las predicciones es crucial:

@app.post("/predict")
async def read_root(data: ProcessTextRequestModel):
    # Lógica principal de la aplicación
    with Session() as session:
        # Cargar modelo preentrenado
        model = joblib.load('model.pql')

        # Crear lista vacía para predicciones
        pred_list = []

        # Procesamiento de inputs
        for sentence in data.sentences:
            # Procesar cada texto y almacenar predicciones
            processed_text = preprocess_text(sentence.text)
            prediction = model.predict(processed_text)
            pred_list.append(prediction)

        # Almacenar resultados en la base de datos
        store_results(pred_list, session)

Definición de función asincrónica: Garantiza que el procesamiento de solicitudes no bloquee la aplicación.
Cargar el modelo: Con joblib, se carga un modelo preentrenado, garantizando predicciones eficientes.
Crear y almacenar predicciones: Cada texto se procesa y predice, almacenando los resultados para su posterior uso.

¿Cómo manejar y decodificar predicciones?

El mapeo de etiquetas identificativas es crítico para transformar predicciones numéricas en descripciones significativas:

label_mapping = {
    0: "Servicio Bancario",
    1: "Reporte de Crédito",
    2: "Hipoteca/Préstamo"
}

# Ejemplo de decodificación
decoded_predictions = [label_mapping[pred] for pred in pred_list]

Label Mapping: Un diccionario que traduce predicciones numéricas a términos comprensibles, conectando directamente con el sentido del negocio.

Este proceso no solo mejora la interpretación de los resultados, sino que también integra una capa adicional de comprensión para los usuarios finales. ¿Estás listo para llevar tus habilidades al siguiente nivel y crear aplicaciones que no solo simplifiquen procesos, sino que también brinden insights valiosos? ¡El camino hacia la excelencia en el desarrollo de software te espera!