Despliegue de Gradio en Hugging Face Spaces

Curso de NLP con Python

Contenido del curso

Introducción y Fundamentos del NLP

Técnicas Tradicionales de NLP para Documentos Empresariales

Introducción y Profundización en Transformers para Aplicaciones Empresariales

Proyecto Final y Estrategia Comercial B2B

Tomar examen

Despliegue de Gradio en Hugging Face Spaces

Resumen

Desplegar un modelo de NLP deja de ser un dolor de cabeza cuando usas Hugging Face Spaces: subes dos archivos, eliges hardware y tu interfaz de Gradio queda pública en minutos. Esta guía te muestra el flujo exacto, pensado para quien ya tiene un notebook funcional y quiere llevarlo a producción.

¿Qué necesitas antes de desplegar en Hugging Face Spaces?

El despliegue se apoya en dos archivos que salen directo de tu notebook de Google Colab.

app.py: es tu notebook convertido a Python. Desde Colab, ve a Archivo y selecciona Descargar .py. El nombre importa: Hugging Face busca específicamente un archivo llamado así [01:00].
requirements.txt: contiene las librerías y versiones que usa tu app. Se genera con un pip freeze dentro del entorno [00:30].

Antes de subirlos, limpia el app.py: elimina las líneas de pip install, los comentarios sobrantes y el parámetro debug=True, porque en producción no quieres ver los logs internos de Gradio [01:35].

¿Por qué el archivo principal debe llamarse app.py? Porque Hugging Face Spaces escanea el repositorio buscando ese nombre exacto para arrancar la aplicación. Si lo nombras distinto, el space no levanta.

¿Qué librerías van en requirements.txt?

Google Colab trae muchas librerías preinstaladas, pero en Spaces necesitas declarar solo las que tu app realmente usa. En este proyecto de análisis de reseñas, la lista queda así:

Torch, TorchAudio y TorchVision, porque Transformers corre por debajo sobre PyTorch [02:10].
Transformers para los modelos preentrenados.
Gradio para la interfaz gráfica.
WordCloud, Pillow y Pandas para visualización y manejo de datos.

Para fijar versiones, copia el número exacto que reporta Colab. Por ejemplo, Pandas aparece como 2.2 y ese mismo valor va al requirements.txt [02:50]. La URL de instalación de PyTorch que muestra Colab indica que se está usando CUDA 12.4 sobre Linux, lo que confirma la compatibilidad con GPU.

¿Cómo crear y configurar un Space en Hugging Face?

Con los dos archivos listos, entra a tu cuenta gratuita de Hugging Face y abre New space. La plataforma ofrece tres recursos: models, datasets y spaces; este último es el que aloja interfaces desplegadas.

En la configuración del space defines varios campos clave:

Nombre y descripción: por ejemplo, Demo Platzi proyecto final con la descripción análisis de reseñas de Mercado Libre.
Licencia: la MIT funciona cuando quieres compartir libremente con la comunidad. La Apache 2.0 aplica si necesitas reservar derechos.
SDK: elige Gradio. También existen opciones para Streamlit, Docker o páginas estáticas con HTML.
Plantilla: como la app es propia, selecciona plantilla vacía.

¿Qué hardware elegir y cuánto cuesta?

Hugging Face ofrece CPU gratuita por defecto, pero los modelos de Transformers exigen GPU por su costo computacional. Si intentas correrlos en CPU, vas a tener conflictos al descargar los pesos del modelo [04:30].

La opción recomendada para pruebas reales es la Nvidia T4, con un costo de 0,40 USD por hora [04:45]. Existe una X0 GPU que requiere membresía pro, así que queda fuera para cuentas estándar.

¿Cuándo me cobra Hugging Face por un Space con GPU? Solo mientras el space está activo. Si configuras un sleep time y pasa ese periodo sin uso, el space se apaga y deja de cobrar.

El parámetro de inactividad es clave para no gastar de más. Puedes definir que el space se duerma a los 5 minutos, 30 minutos o 1 hora sin actividad. Si es un demo de prueba, configurar 30 minutos y luego borrar el space es la forma más segura de controlar el gasto [05:20].

También decides si el space será público o privado. Privado lo limita a ti y a tu equipo, ideal mientras validas que todo corre bien.

¿Cómo subir los archivos y verificar el despliegue?

Una vez creado el space, Hugging Face te da dos rutas para cargar app.py y requirements.txt: Git o arrastrar los archivos desde la interfaz web en Files → Add file [06:00].

Al soltarlos, ocurre algo interesante por debajo: Hugging Face dockeriza tu aplicación. Es decir, empaqueta el código y las dependencias en una imagen de Docker y la despliega dentro de un contenedor aislado. Eso evita conflictos de versiones y garantiza que la app corra igual cada vez que se enciende [06:25].

¿Cuánto tarda en estar lista la aplicación?

El proceso completo de build y deploy puede tomar alrededor de cinco minutos. Mientras tanto, la pestaña App muestra un indicador de carga.

Cuando termina, vas a ver el símbolo running junto a la GPU que elegiste. En la pestaña de Logs puedes confirmar que el contenedor se construyó sin errores y que la interfaz, en este caso con secciones de análisis de texto y análisis de CSV, ya está activa [06:50].

Desde tu perfil, en My spaces, accedes a todos los proyectos desplegados, los enciendes, los pausas o los eliminas según los necesites.

Si te interesa seguir profundizando en NLP después de este flujo de despliegue, el siguiente paso natural son los LLMs o modelos de lenguaje, un área que sigue creciendo y que tiene un peso enorme en la industria. ¿Qué modelo te gustaría desplegar primero en tu propio Space?

Kevin Daniel Mora Gonzalez

Estudiante

¿Cómo podría automatizar el problema que existe, por ejemplo, en una notaría en la que sus empleados redactan datos notariales? Pero, por ejemplo, existen datos especiales en trámites, pero siempre las entradas de los datos son las mismas. Lo único que cambia es la manera de redactar y las nuevas cláusulas en los trámites. Sé que todo esto se puede automatizar, pero no sé cómo empezar a crear esta solución. Tomé este curso, pero tengo ciertas nociones, pero la verdad no sé cómo empezar a solucionar este problema. Siento que debería empezar etiquetando los datos dentro de, por ejemplo, un contrato. Dentro del contrato existen cédulas, nombres, lugares donde fue firmado el contrato. Todo esto debería estar etiquetado para evitar pasarle estos datos al modelo, sino que más bien el modelo aprenda la redacción del contrato y no los datos sensibles de los usuarios.

Kevin Daniel Mora Gonzalez

Estudiante

Investigando, debo empezar hacer esto, ustedes que opinan?.

Automatizar la redacción de documentos notariales implica varios pasos. Primero, efectivamente, comienza etiquetando los datos sensibles en tus contratos. Usa una librería como spaCy o NLTK para el procesamiento de texto y etiquetado.

Etiquetado: Identifica y coloca etiquetas en los datos relevantes (ej., (cédula), (nombre)).
Limpieza de Datos: Asegúrate de eliminar errores de formato, pero conserva las etiquetas como (cédula). Puedes utilizar expresiones regulares para limpiar el texto sin perder las etiquetas.
Entrenamiento del Modelo: Usa un modelo preentrenado (ej., BERT, GPT-3) y ajusta el modelo con tus datos etiquetados. La librería Transformers de Hugging Face es ideal para esto.
Implementación: Finalmente, implementa un script que use el modelo entrenado para generar documentos automáticamente, reemplazando las etiquetas por datos reales en el contexto de la notaría.

Este enfoque asegura que tu modelo aprenda a redactar sin exponer datos sensibles.

Despliegue de Gradio en Hugging Face Spaces

Introducción y Fundamentos del NLP

Automatización de clasificación de textos con Python y NLP

Nube de palabras con reseñas de Amazon

Limpieza de texto con regex en Python

Técnicas Tradicionales de NLP para Documentos Empresariales

Tokenización con NLTK y SpaCy en español

Stemming vs lematización en nubes de palabras

Bag of Words y TF-IDF para representación vectorial de texto

Análisis LDA para detectar temas ocultos en reseñas de texto

Naive Bayes para clasificar reseñas con TF-IDF

Introducción y Profundización en Transformers para Aplicaciones Empresariales

Arquitectura Transformer y cómo funciona BERT

Tokenización en español con Hugging Face

Análisis de sentimientos con Hugging Face

Cómo detectar marcas y lugares con NER

Fine tuning de Roberta para reseñas en español

Proyecto Final y Estrategia Comercial B2B

Análisis de reseñas de MercadoLibre con NLP

Creación de interfaces gráficas con Gradio para apps de IA

Despliegue de Gradio en Hugging Face Spaces

Resumen