MUY IMPORTANTE:
"La correlación no implica causalidad"
Bienvenida e introducción
Todo lo que aprenderás sobre el lenguaje R
Programación y Data Science
R y proyecto economía naranja.
Instalando nuestras herramientas
Variables, tipos de datos y estructuras
Los primeros cálculos con R y variables
Tipos de datos
Estructura del dataset del proyecto
Vectores
Matrices
Ejercicios con matrices
Operadores para comparar y ubicar datos
Factores, listas y echar un vistazo al dataset
EDA: Exploratory data analysis
Qué es EDA: Exploratory Data Analysis
Gráficas de dispersión e histogramas.
Box Plot y su interpretación
EDA con dataset proyecto - Gráficas de dispersión.
EDA con histogramas.
EDA con dataset proyecto - histogramas - ggplot2
EDA con box plot- ggplot2
EDA con dataset proyecto - box plot- ggplot2 - dplyr
EDA con gráficas de dispersión con más de dos variables - ggplot2
EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly
La estadística de los datos
Buscando correlaciones con pairs
Confirmando correlaciones con la función cor
Buscando correlaciones con pairs en dataset proyecto
Confirmando correlaciones con la función cor en dataset proyecto.
Protegiéndonos de los peligros del promedio.
Eliminando los NA's para hacer los cálculos.
Estadística y visualización aplicada a análisis de datos de mercadeo.
Ajustando los datos
Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1
Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2
Mejorando la visualización
Viendo más información con facet wrap - Parte 1
Viendo más información con facet wrap - Parte 2
Organizar visualizaciones y código con R Markdown
Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.
Conclusiones Finales
Invitación a continuar recorriendo el mundo del data science.
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
Sonia Ardila
La función cor
nos retorna la correlación entre los datos. Recordemos que el valor de una correlación va de -1 a 1, si se acerca a 0 no hay correlación.
Aportes 17
Preguntas 3
MUY IMPORTANTE:
"La correlación no implica causalidad"
Buenas tardes, les dejo este link por si desean más información sobre la correlación entre dos variables. https://www.maximaformacion.es/blog-dat/que-es-la-correlacion-estadistica-y-como-interpretarla
“cor() nos apoya a verificar con estadistica lo que nos indican las visualizaciones” con pair()
.
.
.
.
EN ESTA VISUALIZACIÒN DE COCHES merc SE TIENE UNA CORRELACIÒN POSITIVA, EN DONDE A MAYOR CANTIDAD DE CILINDROS -cyl- MAS CABALLOS DE FUERZA -hp-
.
Importante al momento de hablar de correlación, entender que es la correlación espuria. Les comparto un enlace https://economipedia.com/definiciones/relacion-espuria.html
Recordar que la correlación se mueve solo entre dos valores, entre -1 y 1. Si se acerca a 0 no hay correlación, si se acerca a 1 es positiva, si se acerca a -1 es negativa.
pairs(mtcars[,2:6])
cor(mtcars[,2:6])
newdata <- subset(mtcars, select=c(2,7,8,11,12))
pairs(newdata)
cor(newdata)
cor(merc[,2:6])```
Que facil es hacer gráfico y estadístico en Rstudios comparado con Python
Recuerden que la correlación no implica causalidad. Para eso traigo esta pagina, en la que se pueden ver algunos ejemplos con una correlación altisima.
En este punto, pienso que es bueno usar la función round para que los resultados de cor se muestren de forma mas compacta y se facilite su interpretación.
Saludos!!
La correlación estadística constituye una técnica estadística que nos indica si dos variables están relacionadas o no.
cor = función de correlación
-1 > cor < 1
si se acerca de cero: no hay correlación
si se acerca de 1 es positiva
si se acerca a -1 es negativa
#CORRELACIONES CON LA FUNCION COR
#valor de una correlación va de -1 a 1,
#si se acerca a 0 no hay correlación.
#VAMOS A CONFIRMAR SI LA CORRELACIONES ENTRE
#MPG Y DISP ES NEGATIVA
cor(merc[,2:6]) #vemos los cruces e las variables en forma numerica
cor(newdata)
cor(mtcars[,2:6]) #confirmamos ouna correlacion positva entre mas cilindros mas HP
muy interesante!
Mayor cantidad de cilindros CYL más caballos de fuerza HP
Correlación entre el PIB per cápita y la inflación:
GDP.PC Inflation
GDP.PC 1.0000000 0.2755733
Inflation 0.2755733 1.0000000
Conclusión: la correlación es débil.
Correlación entre la inflación y el desempleo:
Inflation Unemployment
Inflation 1.00000000 0.09280426
Unemployment 0.09280426 1.00000000
Conclusión: la correlación es fuerte
*Correlación no indica causalidad.
En esta página puedes ver como correlación no implica causalidad
tylervigen. com/spurious-correlations
#Buscando correlaciones con cor
cor(mtcars[,2:6])
cor(newdata)
cor(merc[, 2:6])
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?