Contenido del curso

Gráficos de dispersión y regresión en Sheets

Resumen

Los gráficos de dispersión son una herramienta clave para visualizar la relación entre dos variables y descubrir patrones que a simple vista pasan desapercibidos. Aquí aprenderás a leerlos, a trazar una línea de regresión y a interpretar su forma, dirección, fuerza y valores atípicos con un ejercicio práctico en Google Sheets.

¿Qué es un gráfico de dispersión y para qué sirve?

Un gráfico de dispersión tabula cada valor de una variable contra otra, punto por punto. Imagina que comparas la cantidad de ventas en un año con el dinero que esas ventas generaron: cada par de datos se convierte en un punto sobre el plano [0:25].

Cuando los puntos se agrupan de cierta forma, puedes trazar una línea que se acerque lo más posible a ellos. Esa es la línea de regresión, y te ayuda a identificar tendencias y a anticipar cómo se comportarán tus datos.

¿Qué es una línea de regresión? Es la línea que mejor se ajusta a los puntos de un gráfico de dispersión. Sirve para describir la tendencia general entre dos variables y proyectar comportamientos futuros.

¿Cómo describir la tendencia de un gráfico de dispersión?

Para leer bien un gráfico de dispersión, fíjate en cuatro elementos: forma, dirección, fuerza y valores atípicos [1:30].

¿Qué forma toma la línea de regresión?

La forma describe el trazo que sigue la línea al intentar asemejar los puntos. Puede ser:

  • Una línea recta, lo que indica una correlación lineal.
  • Una curva tipo parábola, que da una correlación parabólica.
  • Sin forma identificable, en cuyo caso no hay correlación.

¿Qué dirección y fuerza tiene la tendencia?

La dirección indica hacia dónde apunta la tendencia. Si tus ventas crecen, la dirección es positiva; si decrecen, es negativa [2:15].

La fuerza mide qué tan cerca están los puntos respecto a la línea. Cuando la mayoría de los puntos se pegan a la línea, la fuerza es alta y hay pocos valores atípicos. Si los puntos están dispersos, la fuerza es débil y predominan los valores atípicos, esos puntos muy alejados del conjunto.

¿Qué son los valores atípicos en un gráfico de dispersión? Son puntos que se separan notablemente del resto. Cuanto más numerosos sean, más débil será la tendencia que detectes.

¿Cómo hacer un gráfico de dispersión en Google Sheets?

Para este ejercicio se usa una tabla con datos de un estudio del nivel de felicidad por país, que toma en cuenta variables como el producto interno bruto, el apoyo social y la esperanza de vida promedio [4:50].

La idea es comparar dos variables contra el score de felicidad y revisar si influyen directamente. Recuerda algo importante: correlación no implica causalidad.

Comparar esperanza de vida contra score de felicidad

Selecciona las dos columnas que vas a comparar manteniendo presionada la tecla control o command si estás en Mac. Luego ve a insertar y gráfico. Sheets generará automáticamente el gráfico de dispersión.

Para añadir la línea de tendencia:

  1. Abre el menú de personalización del gráfico.
  2. Entra a la pestaña serie.
  3. Activa la opción de línea de tendencia.

En este caso se observa una tendencia positiva con una línea recta. Al activar el coeficiente R cuadrado, el valor ronda 0.6, lo que sugiere una relación moderada: ni muy fuerte ni inexistente.

¿Qué significa el coeficiente R cuadrado? Indica qué tan parecidos están los valores a la línea de regresión. Si vale 1 o -1, la relación es muy fuerte; si se acerca a 0, prácticamente no hay relación.

Comparar generosidad contra nivel de felicidad

Repite el proceso seleccionando la columna de generosidad y la del puntaje de felicidad. Inserta el gráfico, agrega la línea de tendencia desde personalizar y serie, y revisa el coeficiente.

Aquí el R cuadrado da 0, lo que confirma que no hay relación entre la generosidad reportada y el nivel de felicidad del país [8:10]. La gráfica lo dejaba intuir desde el inicio, pero apoyarte en la hoja de cálculo te da la certeza numérica.

¿Cómo practicar lo aprendido sobre regresión y dispersión?

El reto es que repliques el ejercicio con las otras dos comparaciones del archivo: la percepción de corrupción por país contra el nivel de felicidad, y el apoyo social o los servicios públicos contra el nivel de felicidad. Observa la forma, define la dirección, evalúa la fuerza y detecta los valores atípicos en cada caso.

Cuéntame en los comentarios qué tipo de correlación encontraste en cada gráfico y si el coeficiente R cuadrado te sorprendió.