Introducción al despliegue de modelos en producción

Clase 27 de 28 • Curso Profesional de Redes Neuronales con TensorFlow

Resumen

La generación de código para Machine Learning es una parte vasta y en la que se puede profundizar increíblemente, sin embargo, en el gran esquema de las cosas implica una pequeña parte del ciclo de vida entero de un proyecto.

En las siguientes entregas de esta saga se interiorizará sobre el resto de etapas, donde aprenderás a profesionalizarlas.

Ya tienes tus códigos, tus configuraciones y pesos, pero, ¿Cómo los haces accesibles al usuario final?

Ejemplos de producción

Puedes desplegar tus modelos en diferentes dispositivos según tu necesidad.

Si tu proyecto va a ser de consumo masificado, entonces la opción natural será desplegarlo en la nube, donde Google Cloud, Azure, AWS u Oracle Cloud podrán ayudarte. Esta ventaja es especialmente útil si debes escalar tu modelo a mayores capacidades sin necesidad de adquirir un equipo propio.

Si necesitas hacer inferencias en vivo entonces podrías optar por equipo IoT, donde dispositivos como la Raspberry Pi o el Jatson Nanon te ofrecerán una capacidad de cómputo decente para tareas en tiempo real.

Si tienes los recursos necesarios o el proyecto no es tan robusto, puedes correr tus modelos de manera local, donde tus equipos se encargarán de las inferencias.

Un caso final (y una extensión a los últimos 2 casos) sería el de usar un USB Accelerator, hardware con alta capacidad de cómputo que procesa las inferencias con alta facilidad.

Puedes concentrar los recursos de predicción sobre este hardware y dejar descansar al resto del equipo.

Contribución creada por Sebastián Franco Gómez.

Cristian Camilo Polanco Sierra

student•

Super pendiente de un Curso de puestas en producción!!!

frank hurtado

student•

si, ya estoy ansioso de eso, por que esto de los microservicios es algo que me llama mucho la atención.

Christian Ricardo Conchari Cabrera

student•

Sería fantástico un curso de despliegue de modelos en sistemas embebidos aqui en Platzi! 💚.

El desplegar modelos de machine learning en general en sistemas embebidos también puede ser analizado desde el punto de vista del Edge Computing. Se trata de un paradigma de computación donde se lleva el computo al dispositivo final, actualmente es un tópico con mucha investigación, si alguien esta interesado adjunto un paper de investigación que me ayudo mucho cuando estaba comenzando Deep Learning With Edge Computing: A Review.

Hebert Elias Palmera Buelvas

student•

Alguien tendra alguna informacion o articulo que explique como montar tu modelo y testearlo en una raspberry pi 4? tengo un modelo de clasificacion de señales EMG mediantes imagenes de la CWT (Clasificacion de posturas de agarre de mano) pero no he conseguido la forma de testearlo en un raspberry pi con el objetivo de hacer un prototipo de una protesis de mano

Adonai Vera

teacher•

Hola Hebert Elias, Excelente pregunta, aquí es donde realmente se empieza a poner interesante la creación de modelos de visión computarizada. El despliegue de modelo es un tema fundamental porque ya empiezas a tener en cuenta variables como capacidad de cómputo y tiempo de procesamiento (Si buscas que funcione en tiempo real), debes analizar si la raspberry pi resiste el procesamiento de tu algoritmo.

Te dejo dos links que te serviran a configuración: https://pyimagesearch.com/2017/10/16/raspberry-pi-deep-learning-object-detection-with-opencv/

https://pimylifeup.com/raspberry-pi-tensorflow-lite/

Por otra parte, te recomiendo mi curso de visión computarizada, te ayudará a entender más el flujo completo desde el problema hasta puesta en producción. https://platzi.com/cursos/computer-vision-tensorflow/

Me cuentas como te va

Fredy Alberto Orozco Loaiza

student•

Alguien sabe donde se comprar las Jatson Nanos :v, me antojé de una y la verdad si salí muy ansiosa de este curso porque volvió mi amor por la IA

Adonai Vera

teacher•

Hola Fredy Alberto, me alegra mucho leer tu pregunta. Claro que si, en el sitio oficial de Jetson Nano: https://www.nvidia.com/en-us/autonomous-machines/jetson-store/

Aqui Nvidia agrego los proveedores oficiales, creo que los más rapido si no vives en Estados Unidos es Amazon. Yo tengo varias Jetson Nano y siempre las he buscado directamente desde proveedores de USA, sale más economico jeje.

Me cuentas Saludos

Jhon Freddy Tavera Blandon

student•

El despliegue de modelos en producción es el proceso de llevar un modelo de aprendizaje automático desde su etapa de desarrollo y entrenamiento hasta un entorno donde pueda ser utilizado por usuarios finales de manera efectiva y confiable.

Los sistemas embebidos son sistemas informáticos diseñados para realizar una tarea específica dentro de un sistema más grande o un dispositivo electrónico. Estos sistemas están integrados directamente en el hardware del dispositivo y suelen tener recursos limitados en términos de potencia de procesamiento, memoria y almacenamiento en comparación con las computadoras tradicionales

Norberto Iván Tolaba

student•

Muy completo el curso,buenísimo. Sería bueno uno desplegándolo en RaspBerry Pi :)

Adrian Martinez

student•

En esta clase se habla de cosas sumamente interesantes, ya hay un curso sobre eso?

Jorge Marroquin

student•

👋 Saludos Adrian. ¿A cuáles términos te refieres exactamente? Para ayudarte con tu búsqueda en Platzi. :D

Introducción al despliegue de modelos en producción

Cómo utilizar TensorFlow 2.0 con Python

Redes Neuronales y TensorFlow: Crea Modelos de IA desde Cero

Programación con TensorFlow 2 y Python: Fundamentos y Aplicaciones

Manejo y preprocesamiento de datos para redes neuronales

Carga y Procesamiento de Bases de Datos en Inteligencia Artificial

Carga de Bases de Datos JSON desde GCP en Google Colab

Codificación Base64 y Gestión de Imágenes en Google Colab

Preprocesamiento y limpieza de datos

Keras datasets

Datasets generators

Aprende a buscar bases de datos para deep learning

Cómo distribuir los datos

Crear la red neural, definir capas, compilar, entrenar, evaluar y predicciones

Optimización de precisión de modelos

Métodos de regularización: overfitting y underfitting

Recomendaciones prácticas para ajustar un modelo

Métricas para medir la eficiencia de un modelo: callback

Monitoreo del entrenamiento en tiempo real: early stopping y patience

KerasTuner: construyendo el modelo

KerasTuner: buscando la mejor configuración para tu modelo

Almacenamiento y carga de modelos

Almacenamiento y carga de modelos: pesos y arquitectura

Criterios para almacenar los modelos

Fundamentos de aprendizaje por transferencia

Introducción al aprendizaje por transferencia

Cuándo utilizar aprendizaje por transferencia

Carga de sistemas pre-entrenados en Keras

API funcional de Keras

Uso sistemas pre-entrenados de TensorFlow Hub

Resultados de entrenamiento

Introducción a variables relevantes del TensorBoard

Análisis y publicación de resultados del entrenamiento

Introducción al despliegue de modelos en producción

Siguientes pasos con deep learning