Bienvenida e introducción

1

Todo lo que aprenderás sobre el lenguaje R

2

Programación y Data Science

3

R y proyecto economía naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros cálculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qué es EDA: Exploratory Data Analysis

14

Gráficas de dispersión e histogramas.

15

Box Plot y su interpretación

16

EDA con dataset proyecto - Gráficas de dispersión.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gráficas de dispersión con más de dos variables - ggplot2

22

EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly

La estadística de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la función cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la función cor en dataset proyecto.

27

Protegiéndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los cálculos.

29

Estadística y visualización aplicada a análisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualización

32

Viendo más información con facet wrap - Parte 1

33

Viendo más información con facet wrap - Parte 2

Organizar visualizaciones y código con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.

Conclusiones Finales

35

Invitación a continuar recorriendo el mundo del data science.

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

30/35
Recursos

Aportes 12

Preguntas 3

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Clase 30
Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

.
.
Ajuste de datos para mejor visualizacion y facil interpretacion
.
Para agregar nueva columna, con una nueva variable en el dataset
Que los mas eficientes sean los que esten sobre (mayor al) el promedio
.
Paso 1
Creamos una variable
.
efcientes <- mean(dataset$variable)
eficientes
.
Paso 2
Que en el dataset la variable pase a “bajo promeido” , “en o sobre promedio” si el dato
es mayor al promedio de esa variable
.
dataset <- dataset %>%
mutate(mas_eficientes=ifelse(variable<eficientes,
“bajo promedio”, “en o sobre promedio”))
.
.
Solo para ver en consola
Que lo mas veloces sean igual a que la velocidad que se toma en el cuarto de milla
sea menor a 16 segundos

.
Mas_veloces <- dataset [dataset$qsec<16,]
Mas_veloces

PASOS PARA AGREGAR 1 NUEVA VARIABLE AL DATASET:
.

1.- DEFINES LA VARIABLE

.

2.- LA AGREGAS AL DATASET

.

3.- ASI SE VE

Cuando la variable a crear tiene datos que la condicionan puedes usar =ifelse

.

Para que se vea asi

mtcars <- mtcars %>% mutate(Mas_eficientes=ifelse(mpg<eficientes,“Bajo Promedio”,“Sobre Promedio”))
Error in mtcars %>% mutate(Mas_eficientes = ifelse(mpg < eficientes, “Bajo Promedio”, :
could not find function “%>%”

#Ajustando los datos
#Generando tablas, filtrando y seleccionando datos 

eficientes <- mean(mtcars$mpg)
eficientes

#agregando nueva columna a mtcars
mtcars <- mtcars %>%
  mutate(Mas_Eficientes=ifelse(mpg<eficientes, 
                      "Debajo promedio", 
                      "Encima o en el promedio"))

Mas_veloces <- mtcars[mtcars$qsec<16,]
Mas_veloces

#agregando columna a mtcars
mtcars <- mtcars %>%
  mutate(Velocidad_Cuarto_Milla=ifelse(qsec<16,
                    "Menos 16seg",
                    "Mas de 16seg"))

#cambiando a kilos el peso
mtcars <- mtcars %>%
  mutate(Peso_Kilos=(wt/2.2)*1000)

mtcars <- mtcars %>%
  mutate(Peso=ifelse(Peso_Kilos<=1500,
              "Liviano", "Pesado"))

Le estoy cogiendo cariño a R. No les está pasando lo mismo ?

eficientes <- mean(mtcars$mpg)
eficientes

mtcars <- mtcars %>% 
  mutate(Mas_eficientes = ifelse(mpg < eficientes,
                                 "bajo promedio",
                                 "en o sobre promedio"))

Mas_veloces <- mtcars[mtcars$qsec<16,]
Mas_veloces

mtcars <- mtcars %>%
  mutate(Velocidad_cuarto_milla = ifelse(qsec < 16,
                                         "Menos 16 segundos",
                                         "Mas 16 segundos"))

mtcars <- mtcars %>%
  mutate(Peso_kilo = (wt/2.2)*1000)
mtcars <- mtcars %>%
  mutate(Peso = ifelse(Peso_kilo <= 1500,
                       'Livianos',
                       'Pesados'))

Hola. Si les sale error al correr el código:

mtcars=mtcars %>%
mutate(Mas_eficientes=ifelse(mpg<eficientes,
“Bajo promedio”,“En ó sobre promedio”))

Recuerden tener activo dplyr. Les recomiendo poner:
library(dplyr) antes del código anterior.

Se incorpora al dataset ‘mtcars’ la cilindrada del motor, convirtiendo ‘disp’ o ‘displacement’ en ‘cu in’ -pulgadas cúbicas- a ‘cc^3’ -centímetros cúbicos-.

mtcars <- mtcars %>%
  mutate(Cilindrada = (disp*2.54**3))

interesante!

#Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1
#ajustando datos para mejorar visualizaciones

eficientes <- mean(mtcars$mpg)
eficientes

mtcars <- mtcars%>%
  mutate(Mas_eficientes=ifelse(mpg<eficientes,
                               "bajo promedio","En o sobre promedio"))

mas_veloces <-mtcars[mtcars$qsec<16,]
mas_veloces

mtcars <- mtcars%>%
  mutate(Velocidad_cuarto_milla=ifelse(qsec<16,
                                       "menos 16 segs",
                                       "mas de 16 segs"))

mtcars <- mtcars %>% 
  mutate(Peso_kilo=(wt/2)*1000)

mtcars <- mtcars %>%
  mutate(Peso=ifelse(Peso_kilo <= 1500,
                     "livianos","pesados"))

Así me quedo!