Despliega y consume tu modelo en producción

Curso Profesional de Computer Vision con TensorFlow

Contenido del curso

Comprender la visión computarizada

Dimensionamiento de proyecto de visión computarizada

Obtención y procesamiento de los datos

Entrena, testea y optimiza tus modelos

Producto con visión computarizada en producción

Siguientes pasos en inteligencia artificial

Tomar examen

Despliega y consume tu modelo en producción

Mario Alexander Vargas Celis

Estudiante

Para desplegar un modelo en producción y consumirlo, necesitas configurar un entorno donde el modelo esté accesible, por ejemplo, a través de un endpoint de API. En plataformas como Google Cloud Platform (GCP), AWS o Azure, puedes automatizar estos pasos. Aquí te explico cómo hacerlo en Google Cloud Platform utilizando **Vertex AI** para desplegar el modelo y acceder a él en producción.

### Paso 1: **Subir y Preparar el Modelo**

Primero, debes tener el modelo entrenado y listo para ser desplegado. Sube el modelo a Google Cloud Storage (GCS) si aún no lo has hecho.


\# Comando para subir el modelo a GCS

gsutil cp model.joblib gs://\[YOUR\_BUCKET\_NAME]/models/model.joblib

### Paso 2: **Desplegar el Modelo en Vertex AI**

Usaremos **Vertex AI** para crear un endpoint de API donde estará alojado el modelo, permitiendo el consumo de predicciones en tiempo real.

#### a. **Iniciar Vertex AI y Configurar el Proyecto**

Asegúrate de haber configurado Vertex AI para tu proyecto:


from google.cloud import aiplatform



\# Inicializar el entorno de Vertex AI

aiplatform.init(project="my-project", location="us-central1")

#### b. **Crear y Desplegar el Modelo en Vertex AI**

Crea una instancia del modelo en Vertex AI, especificando el URI del modelo en GCS. Esto creará un recurso en Vertex AI que se podrá consumir mediante un endpoint.


\# Crear el modelo desde un archivo en GCS

model = aiplatform.Model.upload(

&#x20;   display\_name="my\_model\_name",

&#x20;   artifact\_uri="gs://\[YOUR\_BUCKET\_NAME]/models/",

&#x20;   serving\_container\_image\_uri="us-docker.pkg.dev/vertex-ai/prediction/sklearn-cpu.0-24:latest"  # Imagen compatible con Scikit-Learn

)

#### c. **Desplegar el Modelo en un Endpoint**

Desplega el modelo en un endpoint de Vertex AI para que esté accesible en producción.


endpoint = model.deploy(

&#x20;   machine\_type="n1-standard-4",  # Especifica el tipo de máquina según tus necesidades

&#x20;   deployed\_model\_display\_name="my\_deployed\_model",

)

print("Endpoint ID:", endpoint.name)

### Paso 3: **Consumir el Modelo en Producción**

Ahora que el modelo está desplegado, puedes enviar solicitudes al endpoint para obtener predicciones. A continuación, muestro cómo hacer una solicitud de predicción con Python.

#### a. **Preparar los Datos de Entrada**

Asegúrate de que los datos estén en el formato que el modelo espera (por ejemplo, una lista de listas o un JSON estructurado).


\# Datos de entrada de ejemplo

instances = \[

&#x20;   \[5.1, 3.5, 1.4, 0.2],  # Reemplaza con tus valores reales

&#x20;   \[6.2, 3.4, 5.4, 2.3],

]

#### b. **Hacer una Solicitud de Predicción**

Con la instancia de endpoint, realiza una predicción enviando los datos de entrada.


prediction = endpoint.predict(instances=instances)

print("Predicción:", prediction.predictions)

### Paso 4: **Acceso al Modelo desde una API REST (Opcional)**

Si quieres consumir el modelo desde otra aplicación, como una API REST, puedes utilizar el ID del endpoint y la **API de Vertex AI** para interactuar con el modelo desde un entorno externo.

1. **Obtener el Token de Autenticación**:

En la mayoría de los casos, necesitarás un token de autenticación para la API de Google Cloud.

```bash

gcloud auth application-default print-access-token

```

2. **Hacer la Solicitud de Predicción con cURL o HTTP**:

Con el token, puedes realizar una solicitud HTTP al endpoint:

```bash

curl -X POST \

-H "Authorization: Bearer $(gcloud auth application-default print-access-token)" \

-H "Content-Type: application/json" \

-d '{

"instances": [[5.1, 3.5, 1.4, 0.2], [6.2, 3.4, 5.4, 2.3]]

}' \

https://us-central1-aiplatform.googleapis.com/v1/projects/\[PROJECT\_ID]/locations/us-central1/endpoints/\[ENDPOINT\_ID]:predict

```

### Paso 5: **Monitoreo y Mantenimiento**

Una vez que el modelo está en producción, es importante monitorearlo para evaluar su rendimiento y realizar ajustes si es necesario:

- **Configura alertas y logs**: GCP te permite monitorear el uso del endpoint y los errores en **Cloud Monitoring** y **Cloud Logging**.

- **Realiza pruebas continuas**: Implementa pruebas para asegurar que el modelo se mantenga preciso con datos nuevos o diferentes.

- **Configura la reentrenamiento automático**: Si el rendimiento decae, configura una pipeline en **Vertex AI Pipelines** para reentrenar el modelo automáticamente con nuevos datos.

Este flujo cubre los pasos básicos para desplegar y consumir un modelo en producción utilizando Google Cloud Platform. Además, puedes extender estos pasos para automatizar el mantenimiento y la actualización del modelo mediante herramientas de MLOps.

Despliega y consume tu modelo en producción

Comprender la visión computarizada

¿Por qué aprender computer vision?

¿Qué es la visión computarizada?

Tipos de visión computarizada

Introducción a object detection: clasificación + localización

Aprende a identificar problemas

Dimensionamiento de proyecto de visión computarizada

Cómo definir los tiempos de tu proyecto

Cómo costear tu proyecto

Cómo identificar los roles necesarios en el proyecto

Producto mínimo viable en computer vision

Obtención y procesamiento de los datos

Obtención de datos para tu proyecto

Limpieza de la base de datos

Distribución de datos en entrenamiento y testeo

Etiquetado de los datos de test

Etiquetado de los datos de train

Transforma tu base de datos a TFRecord

Transformar CSV a TFRecord

Entrena, testea y optimiza tus modelos

Librerías a importar durante fase de entrenamiento

Fase de entrenamiento del modelo

Balanceo de imágenes y data augmentation

Entrena, evalua y optimiza con TensorBoard

Validación de modelo en un entorno de ejecución

Re-entrenamiento del modelo para obtener mejores resultados

Seguimiento de centroides con OpenCV

Configuración de los centroides con OpenCV

Algoritmo de dirección y conteo con OpenCV

Crea un ciclo de entrenamiento de tu modelo: MLOps

Producto con visión computarizada en producción

Prepara tu entorno en Google Cloud Platform

Carga y preprocesamiento de modelos

Postprocesamiento de modelos