Análisis de sentimientos en comentarios deportivos con Python

Clase 20 de 20 • Curso de Fundamentos de Machine Learning

Contenido del curso

Fundamentos de Machine Learning y Contexto Deportivo

Preparación y Exploración de Datos

Ingeniería de Características

Modelado Predictivo Supervisado

Aprendizaje No Supervisado

Resumen

El análisis emocional en el deporte permite a los equipos conectar directamente con las opiniones y sentimientos de la hinchada. Gracias al procesamiento del lenguaje natural (NLP), ahora es posible transformar textos y comentarios de aficionados en datos concretos. Así, podemos responder preguntas cruciales como si los fanáticos están contentos con el último gol o molestos con la defensa, facilitando decisiones más acertadas.

¿Qué es el procesamiento del lenguaje natural (NLP)?

El NLP (Natural Language Processing) es una rama de la inteligencia artificial que capacita a las máquinas para que lean, comprendan y analicen texto en lenguaje humano. Es utilizado diariamente por asistentes virtuales como Siri, Google y ChatGPT para interpretar preguntas u órdenes e interactuar con personas.

En el contexto deportivo, el NLP sirve especialmente para:

Analizar comentarios en redes sociales.
Detectar sentimientos en reportes de prensa.
Evaluar la moral y percepción de los aficionados.

¿Cómo preparar datos textuales para análisis emocional?

La preparación de datos es fundamental para un análisis efectivo. En Python, utilizamos bibliotecas como pandas y regular expression. Estos son los pasos recomendados:

Cargar comentarios deportivos desde archivos CSV con pandas.
Convertir los textos a cadenas para asegurar uniformidad.
Emplear funciones de limpieza para convertir todo a minúsculas y eliminar caracteres no relevantes, puntuación y espacios extra.
Inspeccionar visualmente el resultado con una muestra aleatoria del DataFrame.

¿Cómo generar y usar nubes de palabras?

Una nube de palabras permite visualizar fácilmente los términos más frecuentes en comentarios deportivos. La generación se realiza siguiendo estos pasos:

Importar Word Cloud y matplotlib para visualización.
Eliminar comentarios vacíos o sin contenido significativo.
Concatenar todos los comentarios limpios en una sola cadena de texto.
Generar la nube de palabras con los términos más frecuentes visualizados con claridad.

Al observar la nube generada podemos rápidamente captar términos clave como "equipo", "defensa", "partido" o "técnico".

¿Cómo visualizar la distribución de sentimientos?

Visualizar gráficamente los sentimientos facilita entender rápidamente la opinión general. Usamos Seaborn para generar gráficas claras y descriptivas con:

Diagramas de barras que muestran frecuencias de comentarios positivos, negativos y neutrales.
Títulos y etiquetas que facilitan la interpretación visual rápida.

En nuestro caso vimos una distribución balanceada entre sentimientos positivos, negativos y neutrales.

¿Cómo explorar cualitativamente los comentarios con interacción?

La interactividad con IP Widgets permite al analista seleccionar explícitamente qué tipo de comentarios visualizar, facilitando la revisión cualitativa del sentimiento expresado:

Creación de interfaces interactivas mediante dropdown de selección.
Visualización de muestras aleatorias de comentarios originales y su versión limpia correspondiente.

Esto le permite al analista una inspección directa y efectiva del sentimiento real detrás de los datos generados.

Ahora que tienes conocimientos iniciales en NLP deportivo con Python, estás preparado para aplicar estas herramientas a situaciones concretas, extrayendo información valiosa del texto y transformándola en decisiones estratégicas conectadas emocionalmente con la realidad de cada club y fanático. ¿Qué te llama más la atención del análisis emocional en el deporte y la IA aplicada? ¡Comparte tus ideas!

Comentarios

Cesar Vargas Ochoa

student•

El Curso de Fundamentos de Machine Learning resulta decepcionante. El instructor se limita a leer ejercicios ya resueltos y no explica los conceptos ni el proceso de análisis. En ocasiones muestra poca claridad al interpretar los datos y delega al estudiante tareas que deberían formar parte de la enseñanza. Además, muchos alumnos con mayor experiencia terminan corrigiendo errores u omisiones en los comentarios. En conjunto, el curso no ofrece una base sólida ni cumple con lo esperado para una formación en fundamentos.

Mario Alexander Vargas Celis

student•

El análisis de sentimientos con NLP (Procesamiento de Lenguaje Natural) es ideal para interpretar comentarios de fans, periodistas o redes sociales sobre eventos deportivos, jugadores o equipos.

🎯 ¿Qué es el análisis de sentimientos?

Es una técnica de NLP que detecta la opinión emocional detrás de un texto:

Positivo → elogios, entusiasmo, apoyo
Negativo → críticas, decepción
Neutral → información objetiva o sin carga emocional

🛠️ Herramientas comunes para hacerlo en Python

NLTK / TextBlob → fácil para empezar
Hugging Face Transformers (modelos preentrenados como BERT)
scikit-learn con TF-IDF y regresores
spaCy para tareas de NLP general + extensiones

✅ Pipeline típico de análisis de sentimientos deportivo

1. 🧾 Recolectar comentarios

Ejemplo:

comentarios = [ "¡Qué gran partido jugó Messi!", "Fue una vergüenza el arbitraje.", "El equipo no mostró nada hoy.", "Increíble atajada del arquero.", "Un empate justo, buen nivel de ambos." ]

2. 🧽 Preprocesamiento (con nltk o re)

import re

def limpiar(texto): texto = texto.lower() texto = re.sub(r'[^\w\s]', '', texto) # Eliminar signos return texto

comentarios_limpios = [limpiar(c) for c in comentarios]

3. 📦 Análisis rápido con TextBlob

from textblob import TextBlob

for c in comentarios_limpios: blob = TextBlob(c) print(f"Comentario: {c}") print(f"Polaridad: {blob.sentiment.polarity:.2f} → {'Positivo' if blob.sentiment.polarity > 0 else 'Negativo' if blob.sentiment.polarity < 0 else 'Neutral'}") print()

🧠 ¿Qué hace TextBlob?

polarity: valor entre -1 (negativo) y 1 (positivo)
subjectivity: qué tan subjetivo u objetivo es el texto (opcional para otras tareas)

📈 ¿Y si quiero usar un modelo más potente como BERT?

from transformers import pipeline

clasificador = pipeline("sentiment-analysis", model="nlptown/bert-base-multilingual-uncased-sentiment")

resultados = clasificador(comentarios) for comentario, res in zip(comentarios, resultados): print(f"{comentario} → {res['label']}, score: {res['score']:.2f}")

Este modelo entrega predicciones del 1 al 5 🌟.

🔍 Aplicaciones en deportes

🏟️ Monitorear reacciones en tiempo real durante partidos
👥 Evaluar percepción de fans sobre jugadores o decisiones tácticas
📊 Visualizar tendencias emocionales en redes o foros
📢 Segmentar audiencia por tono de opinión

Javier Emanuel González Andrade

student•

PROMT: "Dime libros para aprender de machine learning"

RESPUESTA de Chat GPT:

Perfecto 🚀 Te hago una lista equilibrada, desde introducción hasta más avanzado, para que puedas aprender Machine Learning paso a paso:

📘 Nivel Principiante

"Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow" – Aurélien Géron 👉 Muy práctico, explica desde lo básico hasta deep learning con ejemplos en Python.
"Introduction to Machine Learning with Python" – Andreas Müller & Sarah Guido 👉 Ideal si ya sabes un poco de Python, te guía con scikit-learn.
"Pattern Recognition and Machine Learning" – Christopher Bishop 👉 Más teórico, excelente para fundamentos matemáticos y probabilísticos.

📘 Nivel Intermedio

"Machine Learning: A Probabilistic Perspective" – Kevin P. Murphy 👉 Muy completo en estadística aplicada al ML.
"Deep Learning" – Ian Goodfellow, Yoshua Bengio & Aaron Courville 👉 Considerado la “biblia” del deep learning.
"Machine Learning Yearning" – Andrew Ng (gratis en PDF) 👉 Más conceptual y estratégico, no tanto código.

📘 Nivel Avanzado

"Bayesian Reasoning and Machine Learning" – David Barber 👉 Enfoque probabilístico y bayesiano.
"Reinforcement Learning: An Introduction" – Richard S. Sutton & Andrew G. Barto 👉 Para RL (aprendizaje por refuerzo).
"Probabilistic Graphical Models" – Daphne Koller & Nir Friedman 👉 Complejo pero excelente para modelos gráficos y razonamiento probabilístico.

📘 Complementos útiles

"The Elements of Statistical Learning" – Hastie, Tibshirani & Friedman (muy matemático pero clásico).
"Data Science for Business" – Provost & Fawcett (más aplicado a negocio, buena perspectiva práctica).

👉 Te recomiendo empezar con Aurélien Géron (muy práctico y ameno), y en paralelo leer Andrew Ng – Machine Learning Yearning para estrategia. Cuando domines lo básico, pasar a Goodfellow (Deep Learning) y a Murphy.

Mauricio Escobar

student••

Buenas 👋 he hecho algunas modificaciones al código, sacando también los acentos. El método que uso es la normalización del texto. Ya que si no lo hacemos, el modelo tratará "canción" y "cancion" como dos palabras distintas. Al normalizarlas a "cancion", se agrupa su significado y el modelo será capaz de manejar ante inconsistencias de escritura.

Este proceso podríamos combinarlo con técnicas como la Lematización, que reduce las palabras a su raíz de diccionario (ejemplo: cantando, canté, etc. --> cantar) Otro tema interesante a investigar es el Stemming.

Dicho esto (específicamente en nuestro caso, que es el español) También sería importante conservar letras únicas d nuestro idioma; como la "ñ", ya que un cambio "n vs ñ" alteraría completamente el significado --> ano y año no es lo mismo 👀

NFD import unicodedata toma un caracter como ó y lo descompone en sus partes base:
la letra o
la marca de acento ´

def limpiar_texto_simple(texto):
    normalizado = unicodedata.normalize('NFD', texto)
    sin_acentos = "".join(caracter for caracter in normalizado 
                          if unicodedata.category(caracter) != 'Mn')
    texto = sin_acentos.lower()
    texto = re.sub(r"[^a-z0-9ñ\n]", " ", texto) # solo letras y espacios (conservando 'ñ')
    texto = re.sub(r"\s+", " ", texto).strip()
    return texto

#limpieza
df_comentarios['comentario_limpio'] = df_comentarios['comentario'].apply(limpiar_texto_simple)
df_comentarios[['comentario', 'comentario_limpio']].sample(10)

Dada la clase anterior, pensé que usaríamos deep Learning para NLP, me quedé con las ganas

Juan Acevedo

student•

Muy bueno el curso profe , Gracias💚

Juan Osorio

teacher•

🤗⚽️

Leyder Sanchez

student•

🚸 Día 👁️‍🗨️ *9* 🙂 ¡Carpe Diem!✌️

Gabriel Obregón

student•

📘 SINTESIS EJERCICIO VISTO EN CLASE DE ANÁLISIS DE COMENTARIOS DEPORTIVOS CON PYTHON (Procesamiento de texto y análisis de sentimientos)

🧾 1. Carga y Preparación de Datos

Librería: pandas
Acción: Se lee el archivo CSV comentarios_deportivos.csv.
Objetivo: Convertir los comentarios a texto (string) para asegurarse de que puedan procesarse correctamente.

🧹 2. Limpieza del Texto

Librería: re (expresiones regulares)
Función creada: limpiar_texto_simple()
Acciones realizadas:Convertir todo el texto a minúsculas.
- Eliminar caracteres no alfabéticos (como puntuación y números).
- Reducir espacios múltiples a uno solo.
Resultado: Columna nueva comentario_limpio con el texto procesado.

☁️ 3. Visualización con Nube de Palabras

Librerías: wordcloud + matplotlib.pyplot
Acciones:
- Se unen todos los comentarios limpios en un solo texto.
- Se genera una word cloud (nube de palabras).
- Se muestra con un gráfico: palabras más frecuentes aparecen más grandes.
Uso: Ideal para detectar temas comunes y vocabulario dominante.

📊 4. Distribución de Sentimientos

Librerías: seaborn + matplotlib.pyplot
Acciones:
- Se cuenta cuántos comentarios hay por tipo de sentimiento (positivo, negativo, neutral).
- Se genera un gráfico de barras para visualizar la distribución.
Propósito: Analizar el tono general de los comentarios.

David Saúl Martínez Sánchez

student•

Tremendo curso. ¡Puro Cebollitas FC!

Fernando Lavao Orjuela

student•

Puedo pensar que el curso fue interesante, pero se podria considerar o discutir otro titulo para este curso, ya que de fundamentos le falta o esta enfocado en mostrar rapidamente los diferentes modelos de machine learning.

Percy Tejada

student•

Gracias al curso y a la guía del profesor Juan Carlos Osorio, quedó claro cómo la inteligencia artificial puede enriquecer el análisis deportivo. Herramientas como regresión, clustering, PCA y NLP permiten entender mejor tanto el rendimiento en cancha como la voz de los hinchas. Una combinación valiosa entre datos y pasión.

Juan Osorio

teacher•

Uhuuuuuu! Excelente Percy! me encanta que te haya gustado

Jason Sepulveda

student•

Buen curso en general, es un buen paso para introducirse en machine learning, bien estructurado, solo las ultimas clases creo que no agregan valor, pero hasta la 19 super bien

aqui pueden seguir el curso

Fernando Lavao Orjuela

student•

Estoy deacuerdo, las primeras 19 clases fueron espectaculares

Esteban Bastías B.

student•

Juan Osorio

teacher•

Excelente infografia!!!

Victor Funez

student••

Liiiiisssstooooo, Gracias Platzi, Gracias Juan Carlos!!! aunque estoy seguro que el curso esta dirigido a personas con experiencia en "ML", y Phyton, me fue dificil comprender al principio, tuve que leer mucho para adaptarme al ritmo y los conceptos.

Víctor Manuel Sánchez Cruz

student•

¡Ojo con este curso de ML! Está bien y es aplicado al deporte, pero no es para principiantes totales. Si ya sabes Python, te servirá. Si no, te va a costar. La comunidad en los comentarios es clave, ahí te pasan algunos tips y explican varios detalles. En resumen: útil si ya traes base, frustrante si empiezas de cero. #Día9Completado

kevin bustamante

student•

dia 9 completado :D aunque costo porque me toco ver bastante por aparte a cerca de phyton

Juan Manuel Hernández Ávila

student•

Día 9 y otro curso más completado :)

Gerardo Elguera Morales

student•

Completado este día 9 cuando tenga los tres meses sin duda repasaré estos conceptos, gracias Platzi por este curso

Yuriesnieva Ramirez

student•

Completado!!! vamos por todos los dias de adviento de platzi

Nidia Mora

student•

Completado dia 9... gracias ...

Janeth Sánchez

student•

completado día 9....

Draxzlers van

student•

Justo estoy terminando ,me falta resolver los quiz no mas

def limpiar_texto_simple(texto):
    normalizado = unicodedata.normalize('NFD', texto)
    sin_acentos = "".join(caracter for caracter in normalizado 
                          if unicodedata.category(caracter) != 'Mn')
    texto = sin_acentos.lower()
    texto = re.sub(r"[^a-z0-9ñ\n]", " ", texto) # solo letras y espacios (conservando 'ñ')
    texto = re.sub(r"\s+", " ", texto).strip()
    return texto

#limpieza
df_comentarios['comentario_limpio'] = df_comentarios['comentario'].apply(limpiar_texto_simple)
df_comentarios[['comentario', 'comentario_limpio']].sample(10)

Análisis de sentimientos en comentarios deportivos con Python

Fundamentos de Machine Learning y Contexto Deportivo

Tipos de modelos de machine learning para análisis deportivo

Modelos supervisados para predecir resultados deportivos

Modelos no supervisados para análisis de rendimiento deportivo

Configuración de Python y Jupyter para análisis deportivo

Preparación y Exploración de Datos

Limpieza y preparación de datos deportivos con Pandas

Análisis estadístico del rendimiento de un equipo de fútbol

Técnicas de escalado de datos con Min Max y Standard Scaler

Ingeniería de Características

Creación de variables predictivas en machine learning

Selección de características con SelectKBest y árboles de decisión

Modelado Predictivo Supervisado

División de datos en machine learning con train_test_split

Creación de modelos de regresión lineal para predecir goles

Métricas para evaluar modelos de Machine Learning en predicciones

Análisis de métricas R² en modelos de regresión deportiva

Cuándo elegir regresión lineal vs árboles de decisión

Aprendizaje No Supervisado

Clasificación automática de jugadores con K-means clustering

Interpretación de clusters de K-means para perfiles de jugadores

Visualización de perfiles de jugadores con análisis PCA

Pipeline y Proyecto Final

Pipelines integrados de machine learning para predicción deportiva

Introducción al Deep Learning

Construcción de redes neuronales básicas con PyTorch

NLP en nuestro caso de uso

Análisis de sentimientos en comentarios deportivos con Python