Análisis de rendimiento deportivo con estadística descriptiva

Clase 6 de 20Curso de Fundamentos de Machine Learning

Resumen

¿Te has preguntado por qué algunos partidos se ganan con facilidad y otros se complican más de lo normal? La respuesta puede encontrarse en los datos, específicamente en cómo se analizan utilizando métodos de estadística descriptiva y visualización gráfica. Antes de predecir los resultados futuros, es esencial comprender en detalle los resultados del pasado.

¿Qué herramientas necesitamos para analizar los partidos?

Para entender qué está pasando en el campo, necesitamos algunas herramientas técnicas fundamentales:

  • Pandas: manipulación y preparación inicial de nuestros datos.
  • Matplotlib y Seaborn: para crear visualizaciones intuitivas que faciliten la interpretación de información compleja.

Estas herramientas nos permiten extraer información crucial, como promedio de goles, desviaciones estándar, máximo y mínimo de goles marcados.

¿Cómo identificar tendencias y patrones clave?

Las siguientes preguntas nos guían en el análisis del rendimiento:

¿Es mejor nuestro desempeño como local o como visitante?

Al observar los promedios encontramos algo inesperado: el equipo tiene en promedio 2.2 goles como local y 2.6 goles como visitante, indicando un rendimiento sólido incluso fuera de casa. Esto sugiere que nuestro rendimiento no depende únicamente del apoyo local.

¿Qué revelan los histogramas sobre nuestros goles?

Los histogramas, realizados con Seaborn, muestran frecuencias reales:

  • Localmente, solemos marcar regularmente 2 a 4 goles.
  • De visitante, aunque hay partidos con cero goles, sorprendentemente también hay varios encuentros en los cuales llegamos a 3 o 5 goles anotados.

Estos gráficos clarifican si nuestro rendimiento es consistente o variable partido a partido.

¿Cómo detectar resultados inusuales con Boxplots?

Los boxplots destacan fácilmente valores extremos:

  • Señalan claramente los partidos excepcionales, tales como goleadas o resultados adversos.
  • Revelan que es frecuente hacer entre 1 y 4 goles cuando jugamos en casa, con picos ocasionales de 5 goles.

Aunque la mayoría de resultados están concentrados en un rango limitado, estos valores ayudan a entender nuestras capacidades en escenarios extraordinarios.

¿Tener más posesión siempre significa más goles?

Probamos esta hipótesis usando un gráfico de dispersión:

  • A pesar de una posesión del 45%, la cantidad de goles anotados varía considerablemente.
  • Diversidad en resultados, desde partidos sin goles hasta encuentros con cinco goles, indica que la posesión sola no determina nuestro rendimiento goleador.

Esto establece una relación compleja entre la posesión del balón y la efectividad goleadora del equipo.

¿Qué revela el mapa de calor sobre correlaciones importantes?

Utilizamos un mapa de calor para detectar conexiones ocultas entre diferentes acciones durante el partido. La correlación más alta registrada entre variables, como goles locales y posesión, es relativamente baja (0.17), indicando que las relaciones entre estas métricas no son extremadamente fuertes.

No obstante, aun siendo significativas, su influencia es moderada, lo cual es útil para modelar predicciones futuras.

¿Qué correlaciones crees que debemos priorizar al momento de entrenar nuestros futuros modelos predictivos? Danos tu opinión en los comentarios sobre qué variables te parecen más determinantes para el rendimiento del equipo.