Modelos listos en Hugging Face sin entrenar

Curso de Fundamentos de AI para Data y Machine Learning

Contenido del curso

Fundamentos de IA

Deep learning: IA a profundidad

Inteligencia artificial aplicada

Machine learning Open-source

Importancia de las matemáticas para desarrollar IA

Ética y uso de datos en IA

El futuro con IA

Tomar examen

Modelos listos en Hugging Face sin entrenar

Resumen

Hugging Face es la plataforma que necesitas conocer si quieres trabajar con inteligencia artificial sin entrenar modelos desde cero. Aquí encontrarás miles de modelos de deep learning listos para usar, datasets abiertos y soluciones para casi cualquier problema que se te ocurra: desde clasificar imágenes hasta resumir textos largos.

Qué es Hugging Face y por qué deberías usarlo

Hugging Face, cuyo nombre significa cara que abraza, es un repositorio colaborativo que centraliza modelos de inteligencia artificial preentrenados. La plataforma vive en huggingface.co y funciona como un buscador especializado donde puedes filtrar por tipo de tarea, idioma o framework.

¿Qué es Hugging Face? Es una plataforma que recopila modelos de machine learning y deep learning ya entrenados, junto con datasets y herramientas para integrarlos en tus aplicaciones. Te ahorra el costo y tiempo de entrenar un modelo desde cero.

Los modelos están organizados por categorías que cubren las áreas principales de la inteligencia artificial [01:00]:

Problemas multimodales que combinan varios tipos de datos.
Visión por ordenador para imágenes y video.
Procesamiento del lenguaje natural para texto.
Audio para voz y sonidos.
Data tabular para información estructurada.
Reinforcement learning para agentes que aprenden por recompensa.

Cómo clasificar y describir imágenes con modelos preentrenados

Imagina que tienes una foto y necesitas saber qué aparece en ella. En la sección Image Classification encuentras modelos como el de Google, que reciben una imagen y devuelven la categoría a la que pertenece [01:30]. Subes una foto de un gato y el modelo responde cat, con opciones secundarias como lince o toalla de papel ordenadas por confianza.

Pero la clasificación a veces se queda corta. Si lo que buscas es una descripción en lenguaje natural, lista para pegar en una presentación, hay modelos de image-to-text que generan oraciones completas. Con la misma foto del gato, el resultado cambia: a cat sitting on a window looking at us. Ya no son etiquetas sueltas, es una frase coherente.

Cada modelo trae un botón Use in Transformers o Use in Diffusers que te entrega el código en Python listo para copiar y pegar en tu aplicación [02:15].

Cómo traducir texto entre idiomas

Si el modelo te devolvió la descripción en inglés y necesitas español, ve a Natural Language Processing y entra a Translation. El filtro Language te permite acotar la búsqueda al idioma que necesitas [03:30]. Eliges un traductor de inglés a español, pegas el texto y obtienes algo como: un gato sentado en un alféizar de la ventana mirando hacia afuera.

Cómo generar imágenes desde texto y resumir documentos largos

La sección de text-to-image es de las más populares hoy. Encuentras varias versiones de Stable Diffusion, incluyendo modelos especializados en estilos o temáticas concretas [04:00]. A diferencia de los modelos de texto, estos no usan Transformers sino Diffusers, una arquitectura distinta basada en procesos de difusión.

¿Cuál es la diferencia entre Transformers y Diffusers? Transformers se usa en modelos de lenguaje y clasificación que procesan secuencias. Diffusers se usa en modelos generativos de imagen como Stable Diffusion, que parten de ruido aleatorio y lo refinan hasta crear una imagen.

Escribes el prompt un gato sentado en la ventana, presionas Compute y después de unos segundos obtienes una imagen generada. Puedes escribirlo en español o inglés, y el resultado puede variar en calidad según el idioma.

Cómo resumir textos largos automáticamente

Dentro de Natural Language Processing está la tarea de Summarization, ideal cuando tienes un documento extenso y solo quieres los puntos clave. Modelos como los de Facebook reciben un texto y devuelven una versión condensada [05:30].

En la prueba con un texto sobre ciencia de datos de Platzi, el modelo extrajo lo esencial: que la data science es utilizada por empresas y organizaciones, y que los diferentes perfiles combinan programación, análisis estadístico, matemáticas y conocimiento del negocio. Todo el contenido reducido a las ideas principales.

¿Para qué sirve la sumarización automática? Sirve para extraer los puntos clave de un texto largo sin leerlo completo. Es útil en investigación, periodismo, análisis de documentos legales o cualquier flujo donde el tiempo de lectura sea un cuello de botella.

Cómo elegir el modelo correcto en Hugging Face

No todos los modelos sirven para lo mismo, y la elección depende de tu caso de uso. Estos son los criterios prácticos que te conviene revisar antes de integrar uno:

La descripción del modelo y los ejemplos de salida.
El framework que usa, Transformers o Diffusers, según tu stack.
El idioma soportado, especialmente en tareas de NLP.
La popularidad y descargas, como señal de confianza de la comunidad.
El widget interactivo en la página del modelo, que te deja probarlo sin escribir código.

La ventaja real de Hugging Face es que cada modelo viene con su tarjeta de documentación, ejemplos reproducibles y el código de integración. Eso convierte a la plataforma en un atajo enorme para prototipar soluciones de inteligencia artificial.

¿Qué modelo de Hugging Face vas a probar primero en tu próximo proyecto? Cuéntame en los comentarios.

Gabriel Obregón

Estudiante

HUGGING FACE es una herramienta que recopila mucha información sobre DEEP LEARNING. Modelos ya entrenados, dataset, etc. En esta clase aprenderemos como usar modelos ya entregados que ofrece esta página. De la página principal de HUGGING FACE vamos a la sección MODELOS (https://huggingface.co/models): Del lado IZQUIERDO, podemos elegir los tipos de modelo. Están clasificados en grupos generales (multimodal, computer vision,natural language processing, audio, data tabular, etc). Estos grupos generales a la vez están divididos en subgrupos.
Una vez elegido el tipo de modelo (subgrupo), del lado DERECHO de la pantalla se listan todos los modelos disponibles del tipo elegido.

Para cada modelo elegido tenemos disponible entre otras cosas: una descripción bastante completa de cada modelo.
Si clickeamos la opción “use in transformers” o “use in diffusers” (dependiendo el caso) nos aparece una ventana donde nos explica cómo implementar el modelo en el código que estamos desarrollando.
Para cada modelo hay una opción interactiva para disponer determinado input para que el modelo lo procese y nos visualice el correspondiente output:

Por ejemplo:

Para un clasificador de imágenes (computer vision, image classification, microsoft/beit-base-partch16-224-pt22k-ft22k): si subimos una imagen esta opción interactiva la clasificará y nos mostrará el respectivo target.
Para un algoritmo que describe una imagen (multimodal, image-to-text, nlpconnect/vit-gpt2-image-captioning): si subimos una imagen nos las describe en inglés.
Para un traductor (natural language processing, translation, helsinki - NLP / opus - mt- es - en): escribimos un texto en inglés para que lo traduzca al español. Al momento de elegir los traductores se puede ir al submenú languages para filtrar por idioma al traductor que se quiere elegir.
Para un algoritmo de texto a imagen (multimodal- text-to-image, runwayml/stable-diffusion-v1-5): escribimos un texto (puede ser en español) y nos presenta la imagen. Para resumir texto (natural languages processing, summarization, facebook/bart-large-cnn): el input es un texto largo y el output el resumen.

Francisco Marín

Estudiante

Gabriel. Muy buen aporte. Muchas gracias

Jesus Daniel Castro Flores

Gerardo Herrera

Jhoan Sebastián Lopera Gallego

Altair Barahona

Leslie Leandro Timoteo

Maritza Flórez

Juan R. Vergara M.

Gustavo Amarista

Daniel Moreno

Erick Alay

Hecot Pulido

Katherine Milagros Quispe Pantoja

Diego Jurado

JORGE GABRIEL QUEZADA HERNANDEZ

Vanessa Carvajal

María Mercedes Eizaga Oberto

Henry S Madrid

Mafe teran

Macarena Gallegos

JULIO CESAR JIMENEZ GARCIA

Alejandro De La Ossa

Keidy Mercado Sierra

Karen Sofia Meza Arrigui

Welsley Nicolas Ortiz Gomez

Jaime Armando Bueno Talamantes

Daniel Dobles

Miguel Angel Reyes Moreno

Modelos listos en Hugging Face sin entrenar

Fundamentos de IA

Fundamentos de la Inteligencia Artificial para Principiantes

IA invisible que ya controla tu día

Qué puede y no puede hacer la IA

Conceptos Clave de Inteligencia Artificial, Machine Learning y Deep Learning

Conceptos Clave de Data Science y Aprendizaje Automático

Qué es machine learning y su ciclo de vida

Casos de éxito y retos reales de la IA

Deep learning: IA a profundidad

Fundamentos y Aplicaciones del Deep Learning

Cuándo no usar Deep Learning

Inteligencia artificial aplicada

Visión Artificial: Aplicaciones y Tecnologías Clave

Qué es el procesamiento del lenguaje natural

Aprendizaje por Refuerzo en Inteligencia Artificial

Qué puede y qué no puede crear la IA generativa

Machine learning Open-source