Correlación entre variables y coeficiente de Pearson
Clase 27 de 27 • Curso de Estadística Descriptiva
Resumen
Conocer y comprender qué es la correlación entre variables es clave para interpretar y aprovechar la información presente en los datos. La correlación nos ayuda a entender cómo dos variables podrían estar relacionadas entre sí, como la cantidad de aplicaciones en tu móvil y el tiempo que dedicas a usarlo. Un ejemplo práctico sería determinar si una mayor inversión en publicidad genera más ventas en una empresa. Hoy aprenderás sobre el coeficiente de correlación de Pearson, cómo interpretarlo visualmente y cómo verificar la exactitud de tus resultados con el indicador R cuadrada.
¿Qué significa correlación positiva, negativa y nula?
La correlación mide cómo dos variables se relacionan al cambiar una respecto a la otra: - Correlación positiva: ambas variables incrementan juntas. Por ejemplo, más aplicaciones instaladas coinciden con más horas usando el celular. - Correlación negativa: una variable incrementa mientras la otra disminuye. Esto no implica algo negativo, sino una relación inversamente proporcional. - Correlación nula: ninguna de las dos variables afecta a la otra perceptiblemente, resultando en datos dispersos sin tendencia definida.
¿Cómo graficar la correlación para visualizar su tendencia?
Para determinar visualmente la correlación, es útil crear un gráfico de dispersión en herramientas como Excel o Google Sheets realizando pasos simples: 1. Copiar y pegar únicamente valores para evitar errores. 2. Ordenar tus datos preferentemente de menor a mayor. 3. Insertar un gráfico adecuado como el de dispersión. 4. Añadir una línea de tendencia para establecer claramente la relación lineal entre ambas variables.
Al visualizarlos, puedes notar claramente una correlación positiva si los puntos tienden a seguir la línea hacia arriba.
¿Cómo calcular e interpretar la ecuación de regresión lineal?
La línea de tendencia, o regresión lineal, formula cómo la variación en una variable puede expresar predicciones sobre cambios en la otra: - La ecuación toma una forma sencilla como: número de horas = 0.0581 × número de aplicaciones + 0.713. - Permite predecir, por ejemplo, que con unas 60 aplicaciones, se espera aproximadamente 4 horas diarias de uso del celular.
¿Qué es la R cuadrada y cómo evaluar la precisión del modelo?
La R cuadrada (R²) determina qué tan precisa y confiable es la correlación calculada: - Cercana al valor "1", indica alta confiabilidad; por ejemplo, R²=0.994 implica una precisión del 99.4%. - Un valor menor, como 0.80, aporta una certeza del 80%, aún considerable, pero menos precisa.
Es crucial este indicador porque valida qué tan fiables son los resultados obtenidos con la ecuación de regresión lineal.
Ahora te toca a ti: ¿cuántas aplicaciones tienes en tu celular y cuántas horas estima este método que lo utilizas al día? ¡Comparte lo que obtuviste y cuéntame si coincide con tu realidad!