Bienvenida e introducción

1

Todo lo que aprenderás sobre el lenguaje R

2

Programación y Data Science

3

R y proyecto economía naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros cálculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qué es EDA: Exploratory Data Analysis

14

Gráficas de dispersión e histogramas.

15

Box Plot y su interpretación

16

EDA con dataset proyecto - Gráficas de dispersión.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gráficas de dispersión con más de dos variables - ggplot2

22

EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly

La estadística de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la función cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la función cor en dataset proyecto.

27

Protegiéndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los cálculos.

29

Estadística y visualización aplicada a análisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualización

32

Viendo más información con facet wrap - Parte 1

33

Viendo más información con facet wrap - Parte 2

Organizar visualizaciones y código con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.

Conclusiones Finales

35

Invitación a continuar recorriendo el mundo del data science.

Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Buscando correlaciones con pairs en dataset proyecto

25/35
Recursos

Aportes 12

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Dato interesante:

Si usan el código:

cor(orangeec[, c(2, 11)])

Se darán cuenta de que la relación que existe entre el GDP.PC y la media de la edad es grandísima! En concreto de un 0.81…

Luego pueden gratificarlo con:

ggplot(orangeec, aes(x= GDP.PC, y= Median.age, colour="blue", label=Country))+
  geom_point() +geom_text(aes(label=Country),hjust=0, vjust=0)+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())

PD: Si alguien puede hacer un gráfico más bonito se lo agradecería mucho XD.

Para relacionar variables que estan seguidas pairs() para eso los :

.
.
Para relacionar variables que no estan seguidas subset() para eso el c() -contenedor-

No reproduce el video

pairs(orangeec[,2:6])
pairs(orangeec[,5:10])

newdata <- subset(orangeec , select = c(5,6,10,11,12,13))

pairs(newdata)

Librería de ciencia de datos:

Tidyverse packages
https://www.tidyverse.org/packages/

install.packages("tidyverse")
library("tidyverse")

siempre son correlaciones lineales?

Me esta funcionando el vídeo debe ser el navegador

## Buscando correlaciones con pairs en dataset proyecto
pairs(orangeec[,2:6])

pairs(orangeec[,5:10])

newdata <- subset(orangeec,select=c(5,6,10,11,12,13))
newdata
pairs(newdata)```
newdata <- subset (orangeec, select=c(5,6,10,11,12,13))```
newdata


pairs(data, main=“Title”)

data: dataframe a graficar o subset
main: titulo del gráfico.

Mayor información consultar: https://www.rdocumentation.org/packages/graphics/versions/3.6.2/topics/pairs

#Buscando correlaciones con pairs en dataset proyecto
pairs(orangeec[,2:6])

pairs(orangeec[,5:10])

#relacion entre columnas desordenadas
newdata <- subset(orangeec, select=c(5,6,10,11,12,13))
newdata #hecha la seleccion

pairs(newdata)

#relacion entre PIB per capita y poblacion en edad media
ggplot(orangeec, aes(x= GDP.PC, 
                     y= Median.age, 
                     label= Country))+
  geom_point() +
  geom_smooth()+
  geom_text()+
  theme(legend.position = "none")