Bienvenida e introducci贸n

1

Todo lo que aprender谩s sobre el lenguaje R

2

Programaci贸n y Data Science

3

R y proyecto econom铆a naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros c谩lculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qu茅 es EDA: Exploratory Data Analysis

14

Gr谩ficas de dispersi贸n e histogramas.

15

Box Plot y su interpretaci贸n

16

EDA con dataset proyecto - Gr谩ficas de dispersi贸n.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gr谩ficas de dispersi贸n con m谩s de dos variables - ggplot2

22

EDA con dataset proyecto usando gr谩ficas de dispersi贸n con m谩s de dos variables - ggplot2 - plotly

La estad铆stica de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la funci贸n cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la funci贸n cor en dataset proyecto.

27

Protegi茅ndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los c谩lculos.

29

Estad铆stica y visualizaci贸n aplicada a an谩lisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualizaci贸n

32

Viendo m谩s informaci贸n con facet wrap - Parte 1

33

Viendo m谩s informaci贸n con facet wrap - Parte 2

Organizar visualizaciones y c贸digo con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del an谩lisis en un documento PDF.

Conclusiones Finales

35

Invitaci贸n a continuar recorriendo el mundo del data science.

No tienes acceso a esta clase

隆Contin煤a aprendiendo! 脷nete y comienza a potenciar tu carrera

Buscando correlaciones con pairs

23/35
Recursos

La funci贸n pairs nos permite cruzar todas las variables del dataset a modo de tabla donde el eje x de una gr谩fica corresponde a la columna donde se encuentra y el eje y a la fila.

  • select: funci贸n para seleccionar variables o columnas.
  • filter: funci贸n para filtrar datos de un dataset, retorna las filas que pasen el filtro.

Aportes 23

Preguntas 10

Ordenar por:

Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Reg铆strate o inicia sesi贸n para participar.

En mi caso durante el largo de todo el curso casi nada me funcionaba, hasta que me di cuenta que por ejemplo mi RStudio tenia el nombre de las variables de orangeec con otros nombres, que en mtcars mis columnas estaban recorridas por un numero menos que el que usas Sonia, lo comento por si a alguien mas le paso 馃槃

Otra forma senecilla de ejecutar pairs sobre columnas seleccionadas es pasando como parametro un contenedor:

pairs(mtcars[,c(1,3,4,5)])

Hola鈥 me sale est error:

merc <- mtcars %>%

  • filter(str_detect(model,鈥淢erc鈥))
    Error in stri_detect_regex(string, pattern, negate = negate, opts_regex = opts(pattern)) :
    object 鈥榤odel鈥 not found

he intentado instalar y desinstalar varias veces pero no me funciona.

Si instalan la librer铆a 鈥渢idyverse鈥 todas las libreras de manipulaci贸n de datos como dyplr, stringr y casi todas las que usan en esta clase, exceptuando por plotly se descargan autom谩ticamente.

Comparto mis notas del curso utilizando la versi贸n 4.0.2 de R y windows 10, espero les sean de utilidad dado que con el tiempo cambian algunas cosas, dejo los datasets y los scripts en el mismo repositorio

https://github.com/rb-one/Fundamentos_R/blob/master/Notes/notes.md

    ##Select

    pairs(mtcars[,2:6])
    #seleccionando las columnas
    newdata <- subset(mtcars, select=c(2,7,8,11,12))
    pairs(newdata)
    #omitiendo columnas 
    pairs(mtcars[,-c(1,3,4,5,6,9,10)])
    pairs(newdata)

    ##Filter

    eficientes <- filter(mtcars, mpg >=30)
    eficientes

    pairs(eficientes[,2:6])

    #
    merc <- mtcars %>%
    filter(str_detect(model,"Merc"))
    merc


    pairs(merc[,2:6])```

En esta oportunidad mis columnas no eran las mismas que Sonia, por lo que toc贸 modificarlas.
Finalmente as铆 qued贸:

newdata <- subset(mtcars, select=c(1,6:7,10,11))
pairs(newdata)

En mi caso me aparecio el siguiente error al usar la funcion de stringr

Error in filter():
! Problem while computing
..1 = str_detect(modeloa, "Merc").
Caused by error in stri_detect_regex():
! object 鈥榤odel鈥 not found
Run rlang::last_error() to see where the error occurred.

La libreria de stringr estaba activada, revisando la data me di cuenta que por alguna razon el nombre de la columna 鈥渕odel鈥 no habia sido cargado con la data, el nombre de la columna estaba en blanco.
Para solucionarlo me fui al documento csv donde se encontraba guardada la data, me asegure que el nombre de la columna estuviera bien, guarde, y volvi a importar la data.

pairs(mtcars[,2:6])

library(dplyr)


#Creando la subset
newdata <- subset(mtcars, select = c(2,7:8,11,12))

pairs(newdata)
#El pairs con las columnas que no queremos
pairs(mtcars[,-c(1,3:6,9:10)])

#uso de filter

Eficientes <- filter(mtcars, mpg >=30)
Eficientes

pairs(Eficientes[,2:6])

library(stringr)

merc <- mtcars %>% 
  filter(str_detect(model,"Merc"))
merc

Para esta parte me toco volver a traer el dataset original por que le habia quitado la coluna con los nombres

Me perdi en la parte de la funcion %>%, de donde salio?..tengo un error de could not find funcion.
No estoy seguro si me salgo algo en alguna clase previa

Es hermoso como se visualiza la data

Probando c贸digos:

mazd<-mtcars%>%
  filter(str_detect(model,"Mazd"))

mazd```

Creo que en este punto ser铆a mas claro de entender que cuando se dice++ Igual a refiriendose a 鈥<-鈥 ++ es que esta variable que estamos a punto de realizar, no es igual a, realmente contiene lo que coloquemos despues, me habia estado confundiendo hasta que entend铆 esta diferencia.

Tuve un problema en esta parte de c贸digo

Merc <-mtcars%>%
  filter(str_detect(model,"Mazd"))
Merc```

al parecer no encuentra la funci贸n "str_detect", si te pasa eso, activa la librer铆a 鈥榮tringr鈥

Al correr la l铆nea:
**Eficientes <- filter(mtcars, mpg >=30)

me sale este error:
Error in filter(mtcars, mpg >= 30) : object 鈥榤pg鈥 not found

驴porque sale asi?

Para los que les salga 鈥淓rror in stri_detect_regex(string, pattern, negate = negate, opts_regex = opts(pattern)) :
objeto 鈥榤odel鈥 no encontrado鈥

Verifique tener activadas las librer铆as:
library(stringr)
library(dplyr)

Me sale el siguiente error al aplicar: newdata <- subset(mtcars, select=c(2,7:8,11,12))

Error in [.data.frame(x, r, vars, drop = drop) :
undefined columns selected

consultilla鈥 porque filter muestra los datos en consola?, no deberia ser en plots??

Hola Sonia, primero agradecerte por el curso muy bueno y practico.

Una consulta cuando ejecuto:
pairs(mtcars)

Me sale el siguiente error la consola:

In addition: Warning messages:
1: In min(x) : no non-missing arguments to min; returning Inf
2: In max(x) : no non-missing arguments to max; returning -Inf```

Sin embargo, cuando ejecuto
``` pairs(mtcars[,2:6])```
No hay ning煤n problema. 
#buscando correlaciones con pairs

pairs(mtcars[,2:6])


#cargar paquete dplyr
newdata <- subset(mtcars, select=c(2,7:8,11,12))
pairs(newdata)


Eficientes <- filter(mtcars, mpg >=30)
Eficientes


#esta es la forma inversa al anterior
pairs(mtcars[,-c(1,3,4,5,6,9,10)])

merc <- mtcars %>%
  filter(str_detect(model, "Merc"))

merc

pairs(merc[,2:6]) #la , signfica seleccion de toas las variables



Les comparto esto, que me pareci贸 genial:

Cheat-sheet de Estad铆stica descriptiva con R

Hola estimada red, comparto este ejemplo en el cual aplique las correlaciones solo para aquellos vehiculos cuya potencia sea mayor a la media.

potentes <- filter(mtcars, hp>=mean(mtcars$hp))
mean(mtcars$hp)
potentes

pairs(potentes[,2:6])