Regresión lineal para predecir goles en fútbol

Clase 11 de 20Curso de Fundamentos de Machine Learning

Resumen

¿Te imaginas poder predecir los goles de tu equipo favorito con métodos precisos? La regresión lineal, un modelo clásico en machine learning, ofrece una herramienta poderosa para asociar variables clave, como posesión del balón y tiros al arco, con la diferencia de goles en cada partido.

¿Qué significa predecir goles usando regresión lineal?

La regresión lineal busca la mejor fórmula matemática para identificar cómo ciertas variables influyen en un resultado específico, como la diferencia de goles. Para esto, se usan datos precisos y claros:

  • Posición de balón.
  • Número de tiros al arco.

Estos datos permiten predecir la diferencia de goles, es decir, cuántos goles más marcará uno de los equipos sobre el contrincante.

¿Cómo preparar los datos para entrenar el modelo?

El proceso es sencillo y directo:

  • Se importa la biblioteca pandas y la función train_test_split.
  • Creación de variable objetivo "diferencia de goles", definida por goles locales menos visitantes.
  • Selección de variables predictoras, que incluyen posesión local y cantidad de tiros al arco.
  • División del conjunto de datos en entrenamiento (80%) y evaluación (20%), manteniendo la consistencia en resultados mediante el parámetro random state.

¿Qué resultados ofrece el modelo de regresión lineal?

Tras entrenar el modelo con la clase Linear Regression de la biblioteca scikit-learn, se obtienen dos elementos clave:

  • Intercepto (beta cero): predicción cuando las variables independientes son cero.
  • Coeficientes (betas): muestran cómo cambia la predicción al incrementar cada variable en una unidad.

Por ejemplo:

  • Incrementar 1 unidad la posesión local cambia en promedio 0.06 la diferencia de goles.
  • Incrementar 1 unidad los tiros al arco locales cambia en promedio -0.05 la diferencia de goles.

Esto ayuda a comprender qué variables merecen atención especial en la estrategia del equipo.

¿Cómo evaluar y visualizar las predicciones?

Luego de hacer las predicciones con modelo_rl.predict, es fundamental visualizar los resultados:

  • Uso de gráficos de dispersión comparando goles reales frente a predichos.
  • Identificación rápida de qué predicciones coinciden mejor con la realidad y cuáles necesitan ajustes.

¿Qué herramientas interactivas aportan valor adicional?

Los controles dinámicos, mediante sliders interactivos, permiten explorar cómo diferentes escenarios en posesión y tiros afectan la predicción final. Esto resulta especialmente útil para demostraciones prácticas y planificación estratégica con el entrenador o jugadores clave del equipo.

¿Has probado previamente una herramienta similar? ¿Cuál ha sido tu experiencia utilizando modelos estadísticos en deportes? ¡Comparte tus opiniones y expectativas sobre estos métodos!