Bienvenida e introducci贸n

1

Todo lo que aprender谩s sobre el lenguaje R

2

Programaci贸n y Data Science

3

R y proyecto econom铆a naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros c谩lculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qu茅 es EDA: Exploratory Data Analysis

14

Gr谩ficas de dispersi贸n e histogramas.

15

Box Plot y su interpretaci贸n

16

EDA con dataset proyecto - Gr谩ficas de dispersi贸n.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gr谩ficas de dispersi贸n con m谩s de dos variables - ggplot2

22

EDA con dataset proyecto usando gr谩ficas de dispersi贸n con m谩s de dos variables - ggplot2 - plotly

La estad铆stica de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la funci贸n cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la funci贸n cor en dataset proyecto.

27

Protegi茅ndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los c谩lculos.

29

Estad铆stica y visualizaci贸n aplicada a an谩lisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualizaci贸n

32

Viendo m谩s informaci贸n con facet wrap - Parte 1

33

Viendo m谩s informaci贸n con facet wrap - Parte 2

Organizar visualizaciones y c贸digo con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del an谩lisis en un documento PDF.

Conclusiones Finales

35

Invitaci贸n a continuar recorriendo el mundo del data science.

A煤n no tienes acceso a esta clase

Crea una cuenta y contin煤a viendo este curso

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

31/35
Recursos

Aportes 20

Preguntas 1

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesi贸n.

Otra alternativa para hacer la tabla con los top es usar la funcion 鈥榯op_n鈥 :

DatasetNuevo <- top_n(dataset,cantidad_datos, variable)

ej:

## Tabla con top_n  -Topnaranjas-

TopNaranjas <- top_n(orangeec,3,Creat.Ind...GDP )```

Todos dejan su forma de sacar los topNaranjas yo dejo la mia:

TopOrange <- head(orangeec %>% arrange(desc(Creat.Ind...GDP)))
TopOrange

Hola compa帽eros. Otra forma de realizar el ejercicio de Ranking.

top <-top_n(orangeec,5,Creat.Ind...GDP)[,] 
top <- top %>% arrange(desc(top$Creat.Ind...GDP))

Saludos

##Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

orangeec <- orangeec %>%
  mutate(Crecimiento_GDP = ifelse(GDP.Growth.. >=2.5,
                                  "2.5% o mas",
                                  "menos de 2.5%"))

orangeec <- orangeec %>%
  mutate(Anaranjados=ifelse(Creat.Ind...GDP >= 2.5,
                            "Mas anaranjados",
                            "Menos anaranjados"))

#ranking

orangeec %>%
  arrange(desc(Creat.Ind...GDP))

TopNaranjas <- orangeec %>%
  filter(Country %in% c("Mexico","Panama","Argentina",
                        "Colombia","Brazil"))

TopNaranjas %>%
  arrange(desc(Creat.Ind...GDP))```

Hola, c贸mo complemento

Funci贸n top_n
Permite realizar filtado

En este caso los 5 n煤meros m谩s altos de la industria creativa

Top <- top_n(orangeec,5,Creat.Ind...GDP)

Para ver los 煤ltimos 5, los m谩s bajos
Se usa el n煤mero negativo

Top <- top_n(orangeec,-5,Creat.Ind...GDP)

:u ya se va acabar el curso y yo a煤n siento que me falta un monton por aprender

Me ha gustado bastante el curso realmente es muy completo y el articulo de sonia me motivo bastante

#orangeec

orangeec <- orangeec %>%
  mutate(Crecimiento_GDP = ifelse(GDP.Growth.. >= 2.5,
                                  "2.5 % 贸 m谩s",
                                  "Menos 2.5%"))

orangeec <- orangeec %>%
  mutate(Anaranjados = ifelse(Creat.Ind...GDP >= 2.5,
                              "Mas anaranjados",
                              "Menos anaranjados"))

orangeec %>%
  arrange(desc(Creat.Ind...GDP))

TopNaranjas <- orangeec %>%
  filter(Country %in% c('Mexico','Panama', 'Argentina','Colombia','Brazil'))

TopNaranjas

TopNaranjas %>% 
  arrange(desc(Creat.Ind...GDP))

PARA LLEGAR A LO + TOP:
.
.

1.- Vision global #ranking de los paises que M脌S aportan al PIB desde sus Creative Industries

.
.

2.- El TOP 5 sin orden de los paises que M脌S aportan al PIB desde sus Creative Industries

.
.

3.- LO + TOP con orden descendente de los paises que M脌S aportan al PIB desde sus Creative Industries

desc() orden que tendran los datos de la variable en el ranking solicitado

Tip: con ctrl + f activan la funcion de busqueda de R studio, tambien sirve para reemplzar palabras.

Yo lo hice as铆:

#Ranking USO DE ORDENAMIENTOS (ARRANGE)
orangeec %>% 
  arrange(desc(Creat.Ind...GDP))
  
Ranking <- orangeec %>% 
  arrange(desc(Creat.Ind...GDP))

Ranking <- my_df[1:5,]

%in% quiere decir que va a buscar las etiquetas establecidas en el c() para la variable filtrada que es Country

Reto: la varaible de peso se categorizara por rangos

interesante!

El Ranking que hizo la profesora est谩 acotado solamente a los pa铆ses que coloc贸 en el filtro, al usar top_n no estamos filtrando nada sino haciendo un ranking con todas las observaciones.

Bastante interesante el poder agregar nuevas variables al dataset a medida que se avanza en el an谩lisis.

Se puede hacer en una sola sentencia ambos comandos:

topNaranja <- orangeec %>%
  filter(Country %in% c("Mexico","Panama","Argentina",
                        "Colombia","Brazil"))%>%
  arrange(desc(AporteEcNja))

Yo organic茅 ese ranking as铆, mostrando los 10 primeros pa铆ses y s贸lo las variables de pa铆s y aporte de la econom铆a naranja

orangeec %>% 
  arrange(desc(Creat.Ind...GDP)) %>% 
  select(1,6) %>% 
  head(10)

Hola, ac谩 una forma m谩s sencilla de poder seleccionar los top de manera descendente

TopNaranjas %>% 
slice_max(Creat.Ind...GDP, n = 5)

Error: Length of ordering vectors don鈥檛 match data frame size

tengo este error en el arrange descendiente