Análisis de sentimientos con Hugging Face

Curso de NLP con Python

Contenido del curso

Introducción y Fundamentos del NLP

Técnicas Tradicionales de NLP para Documentos Empresariales

Introducción y Profundización en Transformers para Aplicaciones Empresariales

Proyecto Final y Estrategia Comercial B2B

Tomar examen

Análisis de sentimientos con Hugging Face

Resumen

Crear un modelo de clasificación de reseñas desde cero implica conseguir un dataset, limpiarlo, entrenarlo y guardarlo antes de poder usarlo. Con los pipelines preentrenados de Hugging Face puedes saltarte ese camino y analizar sentimientos en minutos, incluso en español y con soporte multilingüe.

¿Qué ventaja tienen los modelos preentrenados como BERT o DistilBERT?

Modelos como BERT y DistilBERT fueron entrenados con grandes volúmenes de datos y capturan relaciones entre palabras que sería imposible aprender con un dataset pequeño. Esa base lingüística la puedes especializar en tareas concretas, como el análisis de sentimientos sobre reseñas de productos.

La diferencia con el enfoque tradicional es enorme. Antes elegías entre español o inglés y entrenabas un modelo por idioma. Ahora puedes usar un modelo multilingüe que soporta hasta seis lenguajes desde la misma llamada.

¿Qué es un pipeline en Hugging Face? Es una abstracción que une el preprocesamiento del texto, el modelo preentrenado y el postprocesamiento en una sola función. Tú pasas el texto y recibes el resultado listo para usar.

¿Cómo defino un pipeline de análisis de sentimientos en español?

La receta es simple: importas el método pipeline, defines la tarea y eliges el modelo según el idioma y el problema que quieres resolver. En Hugging Face, dentro de la ficha del modelo, encuentras la opción use this model → transformer y puedes copiar el snippet directamente.

python from transformers import pipeline

classifier = pipeline( task="sentiment-analysis", model="nlptown/bert-base-multilingual-uncased-sentiment" )

review = "Este producto es excelente y superó mis expectativas" result = classifier(review)

Al ejecutarlo recibes el texto procesado, un score de confianza y, en este modelo en particular, también las stars que califican la reseña en una escala estilo e-commerce. La latencia ronda un segundo, así que es viable usarlo en flujos prácticos.

¿Qué devuelve el modelo cuando paso una reseña positiva?

Con la frase "este producto es excelente y superó mis expectativas" el modelo devuelve un score cercano a 0.7 y una calificación alta en estrellas. Es el caso típico: texto claro, vocabulario positivo, resultado contundente.

¿Cómo afectan los emojis y signos de puntuación al análisis?

Aquí viene lo interesante. El texto real que escribimos en redes sociales no es prosa limpia: tiene emojis, guiños, signos de exclamación repetidos. El modelo lo nota.

"Lo odio 😉!" devuelve un score de 0.61, una negatividad moderada porque el guiño suaviza la frase.
"Me encantó?" devuelve 0.49, justo en la frontera de lo negativo, porque el signo de interrogación introduce duda.
"Me encantó!" sube el score a 0.87, claramente positivo.
"¡Me encantó!!!" con varios signos de exclamación, el score baja un poco respecto a un solo signo.

Pequeños cambios en la puntuación mueven la aguja. Eso refleja cómo procesamos el lenguaje las personas: no es lo mismo afirmar que preguntar, ni un entusiasmo medido que uno desbordado.

¿Por qué cambia el score si solo modifico un signo? Porque los modelos tipo BERT aprenden el contexto completo del texto, no palabra por palabra. La puntuación es parte del contexto y el modelo la pondera al calcular la probabilidad.

¿Qué tan multilingüe es el modelo elegido?

El modelo que usamos en el ejemplo soporta hasta seis idiomas, lo que te permite analizar reseñas mezcladas sin entrenar versiones separadas. Si tu producto vive en mercados distintos, esto te ahorra meses de trabajo.

¿Cómo aplico esto a reseñas reales de e-commerce?

El flujo de trabajo queda así:

Define el pipeline con la tarea sentiment-analysis y el modelo multilingüe.
Pasa el texto de la reseña tal como lo escribió el usuario, con emojis y puntuación incluidos.
Lee el score y, si el modelo lo entrega, también las estrellas.
Compara resultados entre variantes del mismo texto para entender qué señales pesan más.

Te dejo el reto: entra a tu plataforma de compra favorita, copia un comentario real, pásalo por este pipeline y observa cómo se comporta. ¿Coincide el score con tu intuición? ¿Qué pasa cuando el comentario tiene sarcasmo o ironía? Comparte tus hallazgos en los comentarios y comparemos resultados.

Comentarios6

Javier Ramos

Estudiante

Definitivamente este curso es cosa seria, voy a tener que aplicar metodologias de estudio aprendidas en Platzi y sacarle el maxiumo provecho , felcitaciones

Javier Ramos

Estudiante

El análisis de sentimiento es una técnica de procesamiento del lenguaje natural (NLP) que permite identificar y clasificar las emociones expresadas en un texto, como positivo, negativo o neutral. Utiliza modelos preentrenados, como los de la biblioteca Hugging Face, que han sido entrenados con grandes volúmenes de datos para entender relaciones lingüísticas. Esto es útil para aplicaciones como la evaluación de reseñas de productos, permitiendo a las empresas obtener información sobre la percepción de sus servicios o productos.

Javier Ramos

Estudiante

Comentario generado por la IA de Platzi a la pregunta que es análisis de sentimiento

jose maria español bellera

Estudiante

Todos los ejemplos son 5 stars, algo esta fallando no les parece?

Juan Acevedo

Estudiante

Original: Me costó mucho armar la silla, la verdad llevaba mas de 40 minutos intentando, pero busque un video y la arme en 10 minutos. Pará personas bajitas esta super super comoda.
Predicción: [{'label': '5 stars', 'score': 0.4231673777103424}]

Laura Torres

Estudiante

Veo preguntas interesantes sin respuesta. Eso es lo que no me gusta de Platzi, me interesa saber sobre el uso de transformadores para la detección de temas ocultos con LDA, además de encontrar esos temas ocultos poder darles una categoría.

Néstor Miguel González Flores

Estudiante

si en lugar de clasificar el sentimiento, quiero descubrir temáticas y hacer una agrupación por ellas, similar a trending topic?

por ejemplo, saber qué filas son del tema 1, cuáles del tema 2 y tema 3, similar a lo que se hace en el notebook parte 2: LatentDirichletAllocation

Análisis de sentimientos con Hugging Face

Introducción y Fundamentos del NLP

Automatización de clasificación de textos con Python y NLP

Nube de palabras con reseñas de Amazon

Limpieza de texto con regex en Python

Técnicas Tradicionales de NLP para Documentos Empresariales

Tokenización con NLTK y SpaCy en español

Stemming vs lematización en nubes de palabras

Bag of Words y TF-IDF para representación vectorial de texto

Análisis LDA para detectar temas ocultos en reseñas de texto

Naive Bayes para clasificar reseñas con TF-IDF

Introducción y Profundización en Transformers para Aplicaciones Empresariales

Arquitectura Transformer y cómo funciona BERT

Tokenización en español con Hugging Face