Bienvenida e introducción

1

Todo lo que aprenderás sobre el lenguaje R

2

Programación y Data Science

3

R y proyecto economía naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros cálculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qué es EDA: Exploratory Data Analysis

14

Gráficas de dispersión e histogramas.

15

Box Plot y su interpretación

16

EDA con dataset proyecto - Gráficas de dispersión.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gráficas de dispersión con más de dos variables - ggplot2

22

EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly

La estadística de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la función cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la función cor en dataset proyecto.

27

Protegiéndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los cálculos.

29

Estadística y visualización aplicada a análisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualización

32

Viendo más información con facet wrap - Parte 1

33

Viendo más información con facet wrap - Parte 2

Organizar visualizaciones y código con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.

Conclusiones Finales

35

Invitación a continuar recorriendo el mundo del data science.

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Confirmando correlaciones con la función cor

24/35
Recursos

La función cor nos retorna la correlación entre los datos. Recordemos que el valor de una correlación va de -1 a 1, si se acerca a 0 no hay correlación.

Aportes 17

Preguntas 3

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

MUY IMPORTANTE:

"La correlación no implica causalidad"

Buenas tardes, les dejo este link por si desean más información sobre la correlación entre dos variables. https://www.maximaformacion.es/blog-dat/que-es-la-correlacion-estadistica-y-como-interpretarla

cor() nos apoya a verificar con estadistica lo que nos indican las visualizaciones” con pair()
.
.
.
.
EN ESTA VISUALIZACIÒN DE COCHES merc SE TIENE UNA CORRELACIÒN POSITIVA, EN DONDE A MAYOR CANTIDAD DE CILINDROS -cyl- MAS CABALLOS DE FUERZA -hp-
.

Importante al momento de hablar de correlación, entender que es la correlación espuria. Les comparto un enlace https://economipedia.com/definiciones/relacion-espuria.html

Recordar que la correlación se mueve solo entre dos valores, entre -1 y 1. Si se acerca a 0 no hay correlación, si se acerca a 1 es positiva, si se acerca a -1 es negativa.

    pairs(mtcars[,2:6])
    cor(mtcars[,2:6])

    newdata <- subset(mtcars, select=c(2,7,8,11,12))
    pairs(newdata)
    cor(newdata)
    
    cor(merc[,2:6])```

Que facil es hacer gráfico y estadístico en Rstudios comparado con Python

Recuerden que la correlación no implica causalidad. Para eso traigo esta pagina, en la que se pueden ver algunos ejemplos con una correlación altisima.

https://www.tylervigen.com/spurious-correlations

En este punto, pienso que es bueno usar la función round para que los resultados de cor se muestren de forma mas compacta y se facilite su interpretación.
Saludos!!

La correlación estadística constituye una técnica estadística que nos indica si dos variables están relacionadas o no.

cor = función de correlación
-1 > cor < 1
si se acerca de cero: no hay correlación
si se acerca de 1 es positiva
si se acerca a -1 es negativa

#CORRELACIONES CON LA FUNCION COR
#valor de una correlación va de -1 a 1, 
#si se acerca a 0 no hay correlación.
#VAMOS A CONFIRMAR SI LA CORRELACIONES ENTRE
#MPG Y DISP ES NEGATIVA

cor(merc[,2:6]) #vemos los cruces e las variables en forma numerica 

cor(newdata)

cor(mtcars[,2:6]) #confirmamos ouna correlacion positva entre mas cilindros mas HP

muy interesante!

Mayor cantidad de cilindros CYL más caballos de fuerza HP

Correlación entre el PIB per cápita y la inflación:

             GDP.PC           Inflation

GDP.PC 1.0000000 0.2755733
Inflation 0.2755733 1.0000000

Conclusión: la correlación es débil.

Correlación entre la inflación y el desempleo:

                               Inflation               Unemployment

Inflation 1.00000000 0.09280426
Unemployment 0.09280426 1.00000000

Conclusión: la correlación es fuerte

*Correlación no indica causalidad.

En esta página puedes ver como correlación no implica causalidad
tylervigen. com/spurious-correlations

#Buscando correlaciones con cor
cor(mtcars[,2:6])

cor(newdata)

cor(merc[, 2:6])