Bienvenida e introducción

1

Todo lo que aprenderás sobre el lenguaje R

2

Programación y Data Science

3

R y proyecto economía naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros cálculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qué es EDA: Exploratory Data Analysis

14

Gráficas de dispersión e histogramas.

15

Box Plot y su interpretación

16

EDA con dataset proyecto - Gráficas de dispersión.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gráficas de dispersión con más de dos variables - ggplot2

22

EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly

La estadística de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la función cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la función cor en dataset proyecto.

27

Protegiéndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los cálculos.

29

Estadística y visualización aplicada a análisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualización

32

Viendo más información con facet wrap - Parte 1

33

Viendo más información con facet wrap - Parte 2

Organizar visualizaciones y código con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.

Conclusiones Finales

35

Invitación a continuar recorriendo el mundo del data science.

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Buscando correlaciones con pairs

23/35
Recursos

La función pairs nos permite cruzar todas las variables del dataset a modo de tabla donde el eje x de una gráfica corresponde a la columna donde se encuentra y el eje y a la fila.

  • select: función para seleccionar variables o columnas.
  • filter: función para filtrar datos de un dataset, retorna las filas que pasen el filtro.

Aportes 26

Preguntas 12

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

En mi caso durante el largo de todo el curso casi nada me funcionaba, hasta que me di cuenta que por ejemplo mi RStudio tenia el nombre de las variables de orangeec con otros nombres, que en mtcars mis columnas estaban recorridas por un numero menos que el que usas Sonia, lo comento por si a alguien mas le paso 😄

Otra forma senecilla de ejecutar pairs sobre columnas seleccionadas es pasando como parametro un contenedor:

pairs(mtcars[,c(1,3,4,5)])

Si instalan la librería “tidyverse” todas las libreras de manipulación de datos como dyplr, stringr y casi todas las que usan en esta clase, exceptuando por plotly se descargan automáticamente.

En mi caso me aparecio el siguiente error al usar la funcion de stringr

Error in filter():
! Problem while computing
..1 = str_detect(modeloa, "Merc").
Caused by error in stri_detect_regex():
! object ‘model’ not found
Run rlang::last_error() to see where the error occurred.

La libreria de stringr estaba activada, revisando la data me di cuenta que por alguna razon el nombre de la columna “model” no habia sido cargado con la data, el nombre de la columna estaba en blanco.
Para solucionarlo me fui al documento csv donde se encontraba guardada la data, me asegure que el nombre de la columna estuviera bien, guarde, y volvi a importar la data.

Hola… me sale est error:

merc <- mtcars %>%

  • filter(str_detect(model,“Merc”))
    Error in stri_detect_regex(string, pattern, negate = negate, opts_regex = opts(pattern)) :
    object ‘model’ not found

he intentado instalar y desinstalar varias veces pero no me funciona.

    ##Select

    pairs(mtcars[,2:6])
    #seleccionando las columnas
    newdata <- subset(mtcars, select=c(2,7,8,11,12))
    pairs(newdata)
    #omitiendo columnas 
    pairs(mtcars[,-c(1,3,4,5,6,9,10)])
    pairs(newdata)

    ##Filter

    eficientes <- filter(mtcars, mpg >=30)
    eficientes

    pairs(eficientes[,2:6])

    #
    merc <- mtcars %>%
    filter(str_detect(model,"Merc"))
    merc


    pairs(merc[,2:6])```

Les comparto esto, que me pareció genial:

Cheat-sheet de Estadística descriptiva con R

En esta oportunidad mis columnas no eran las mismas que Sonia, por lo que tocó modificarlas.
Finalmente así quedó:

newdata <- subset(mtcars, select=c(1,6:7,10,11))
pairs(newdata)

Chicos cabe recordar que acá se utilizo stringr este paquete tiene varias herrmientas para la cedena de caracteres por eso el nombre de string. en este caso se utilizo el de detectar coincidencia y una de ella es str_detect. en el caso que sea numerico ya no seria detect en ese caso seria count (str_count) asi como localizar posicion seria con locate (str_locate).

Para los que les salga “Error in stri_detect_regex(string, pattern, negate = negate, opts_regex = opts(pattern)) :
objeto ‘model’ no encontrado”

Verifique tener activadas las librerías:
library(stringr)
library(dplyr)

Hola estimada red, comparto este ejemplo en el cual aplique las correlaciones solo para aquellos vehiculos cuya potencia sea mayor a la media.

potentes <- filter(mtcars, hp>=mean(mtcars$hp))
mean(mtcars$hp)
potentes

pairs(potentes[,2:6])
pairs(mtcars[,2:6])

library(dplyr)


#Creando la subset
newdata <- subset(mtcars, select = c(2,7:8,11,12))

pairs(newdata)
#El pairs con las columnas que no queremos
pairs(mtcars[,-c(1,3:6,9:10)])

#uso de filter

Eficientes <- filter(mtcars, mpg >=30)
Eficientes

pairs(Eficientes[,2:6])

library(stringr)

merc <- mtcars %>% 
  filter(str_detect(model,"Merc"))
merc

Para esta parte me toco volver a traer el dataset original por que le habia quitado la coluna con los nombres

Me perdi en la parte de la funcion %>%, de donde salio?..tengo un error de could not find funcion.
No estoy seguro si me salgo algo en alguna clase previa

Es hermoso como se visualiza la data

Probando códigos:

mazd<-mtcars%>%
  filter(str_detect(model,"Mazd"))

mazd```

Creo que en este punto sería mas claro de entender que cuando se dice++ Igual a refiriendose a “<-” ++ es que esta variable que estamos a punto de realizar, no es igual a, realmente contiene lo que coloquemos despues, me habia estado confundiendo hasta que entendí esta diferencia.

Tuve un problema en esta parte de código

Merc <-mtcars%>%
  filter(str_detect(model,"Mazd"))
Merc```

al parecer no encuentra la función "str_detect", si te pasa eso, activa la librería ‘stringr’
A algunos, la primera columna nos aparece como nombres de fila y no como columna 'model'. Entonces, se puede usar el siguiente código: ```js merc <- mtcars %>% filter(str_detect(rownames(mtcars), "Merc")) ```

les recomiendo este curso deyt de R para complementar con lo que dice la profesora:
https://www.youtube.com/watch?v=HVB0kt5ODh0&list=PLdV8ntSOIL5SqS4-sbms4M_puIIucPwmh&index=1

Aplicando un poco de formato

df <- mtcars[,1:5]
pairs(df)

pairs(df,       # Datos
      pch = 20, # Símbolo pch
      col = "#749F82",  # Color
      main = "Correlación",    # Título
      gap = 0.5,           # Distancia entre gráficos
      row1attop = TRUE, # Dirección de la diagonal
      labels = colnames(df), # Etiquetas
      cex.labels = 2,  # Tamaño textos diagonales
      font.labels = 1)  

Al correr la línea:
**Eficientes <- filter(mtcars, mpg >=30)

me sale este error:
Error in filter(mtcars, mpg >= 30) : object ‘mpg’ not found

¿porque sale asi?

Me sale el siguiente error al aplicar: newdata <- subset(mtcars, select=c(2,7:8,11,12))

Error in [.data.frame(x, r, vars, drop = drop) :
undefined columns selected

consultilla… porque filter muestra los datos en consola?, no deberia ser en plots??

Hola Sonia, primero agradecerte por el curso muy bueno y practico.

Una consulta cuando ejecuto:
pairs(mtcars)

Me sale el siguiente error la consola:

In addition: Warning messages:
1: In min(x) : no non-missing arguments to min; returning Inf
2: In max(x) : no non-missing arguments to max; returning -Inf```

Sin embargo, cuando ejecuto
``` pairs(mtcars[,2:6])```
No hay ningún problema. 
#buscando correlaciones con pairs

pairs(mtcars[,2:6])


#cargar paquete dplyr
newdata <- subset(mtcars, select=c(2,7:8,11,12))
pairs(newdata)


Eficientes <- filter(mtcars, mpg >=30)
Eficientes


#esta es la forma inversa al anterior
pairs(mtcars[,-c(1,3,4,5,6,9,10)])

merc <- mtcars %>%
  filter(str_detect(model, "Merc"))

merc

pairs(merc[,2:6]) #la , signfica seleccion de toas las variables