Bienvenida e introducción

1

Todo lo que aprenderás sobre el lenguaje R

2

Programación y Data Science

3

R y proyecto economía naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros cálculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qué es EDA: Exploratory Data Analysis

14

Gráficas de dispersión e histogramas.

15

Box Plot y su interpretación

16

EDA con dataset proyecto - Gráficas de dispersión.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gráficas de dispersión con más de dos variables - ggplot2

22

EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly

La estadística de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la función cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la función cor en dataset proyecto.

27

Protegiéndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los cálculos.

29

Estadística y visualización aplicada a análisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualización

32

Viendo más información con facet wrap - Parte 1

33

Viendo más información con facet wrap - Parte 2

Organizar visualizaciones y código con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.

Conclusiones Finales

35

Invitación a continuar recorriendo el mundo del data science.

Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Confirmando correlaciones con la función cor en dataset proyecto.

26/35
Recursos

Aportes 19

Preguntas 4

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Cada clase me gusta mas, gracias profe

Clase 26 🙂
Confirmando correlaciones con la función cor en dataset proyecto

.
.
Con cor confirmo si la aparente correlacion vista en la grafica de dispersion
existe o no existe
.
cor(dataset[,])
.
.
Los NA no sirven
Se necesitan numeros frente a numeros para tener la correlacion
Para eliminar los NA
.
cor(dataset[,], use=“complete.obs”)

Tomar en cuenta que en el video, al decir que “no es negativa” (el valor de -0.4412) se refiere a que no se considera que haya correlacion, ya que se descartan las correlaciones que estan mas cercanas al cero que al 1 o -1.
Por lo tanto, se considera que hay correlacion cuando el valor es menor que -0.5 o mayor que 0.5

Es muy interesante la facilidad que tiene R, para tratar con los datos, por ejemplo el cálculo de de la correlación ignorando los NA, solo con un comando

Pienso que igual si la correlación pasa de 0.2… se entiende que hay valores que influyen en que sea positiva, mientras que los resultados que si aparecieran en negativo directamente están siento descartables

Pues me quedo la duda cuando menciono que el crecimiento era del 0.3 pudiese descartarse pero aun así muestra rasgos significativos resaltables

pairs(orangeec[,5:10])

cor(orangeec[,2:6],use = "complete.obs")

Para que haya correlación de variables los datos deben estar comprendidos entre 1 y -1 cuando hay un valor como por ejemplo el -04412121 como esta mas cerca del 0 entonces no existe correlación.

a partir de que valor se puede decir que una correlacion es negativa, positiva o neutro (si existe)?

En mi opinión lo que se explica en el vídeo puede que este en parte mal explicado, ya que ella afirma que si la correlación es menor a 0.5 o a -0.5 no existe, siendo esta una afirmación falsa, ya que la correlación si existe, ya que de 0 a 0.33 o en su defecto a -0.33, es una correlación baja, de 0.33 a 0.66, es una correlación media, y de 0.66 a 1 es alta.
Algo a tomar en cuenta para próximas revisiones de vídeos.

Me sale el siguiente erro, alguna idea de qué falla?

cor(orangeec[,2:6],use="complete.obs")
Error in cor(orangeec[, 2:6], use = "complete.obs") : 'x' must be numeric

Por que la relacion de desempleo y aporte de la economia naranja ( -0.41885405) se dice que no es negativo??? si tiene un menos ( - ) y no este por encima de 0.5… al igual que 0.025…

## Confirmando correlaciones con la función cor en dataset proyecto.

cor(orangeec[,2:6])
#solucionando n/a

cor(orangeec[,2:6],use="complete.obs")

cor(orangeec[,5:10],use="complete.obs")

cor(newdata,use="complete.obs")```

Quitar NA

.
.
¡Interpreta correctamente la informaciòn que ves en r para que puedas comunicar lo observado. el objetivo es que logremos usar el programa con agilidad y asi hacer un analisis mas rapido!

Cuando la cor() es inferior a 0.5 es negativa; esta mas cerca del 0 no hay correlacion entre las variables analizadas

La relacion entre el Aporte de los Servicios al PIB del pais (Service...GDP) y el PIB per capita en cada pais (GDP.PC) es positiva con un 0.64 de correlacion. Es decir los paises que han tenido MAS aporte al PIB desde sus Servicios tienen un PIB per capita MAYOR

cor(orangeec[,2:6],use="complete.obs")

cor(orangeec[,5:10],use="complete.obs")

cor(newdata,use="complete.obs")
#Confirmando correlaciones con la funcion COR
cor(orangeec[,2:6]) #Si salen NA no nos sirven esos datos

#en esta linea ponemos solo las obsevaciones que esten completas
cor(orangeec[,2:6], use = "complete.obs")

cor(orangeec[,5:10], use = "complete.obs")

cor(newdata, use="complete.obs")
cor(orangeec[,2:6])
#solucionar NA
cor(orangeec[,2:6], use="complete.obs")
cor(orangeec[,5:10], use="complete.obs")
cor(newdata, use="complete.obs")