Bienvenida e introducción

1

Todo lo que aprenderás sobre el lenguaje R

2

Programación y Data Science

3

R y proyecto economía naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros cálculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qué es EDA: Exploratory Data Analysis

14

Gráficas de dispersión e histogramas.

15

Box Plot y su interpretación

16

EDA con dataset proyecto - Gráficas de dispersión.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gráficas de dispersión con más de dos variables - ggplot2

22

EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly

La estadística de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la función cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la función cor en dataset proyecto.

27

Protegiéndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los cálculos.

29

Estadística y visualización aplicada a análisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualización

32

Viendo más información con facet wrap - Parte 1

33

Viendo más información con facet wrap - Parte 2

Organizar visualizaciones y código con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.

Conclusiones Finales

35

Invitación a continuar recorriendo el mundo del data science.

Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

31/35
Recursos

Aportes 20

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Otra alternativa para hacer la tabla con los top es usar la funcion ‘top_n’ :

DatasetNuevo <- top_n(dataset,cantidad_datos, variable)

ej:

## Tabla con top_n  -Topnaranjas-

TopNaranjas <- top_n(orangeec,3,Creat.Ind...GDP )```

Todos dejan su forma de sacar los topNaranjas yo dejo la mia:

TopOrange <- head(orangeec %>% arrange(desc(Creat.Ind...GDP)))
TopOrange

Hola compañeros. Otra forma de realizar el ejercicio de Ranking.

top <-top_n(orangeec,5,Creat.Ind...GDP)[,] 
top <- top %>% arrange(desc(top$Creat.Ind...GDP))

Saludos

##Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

orangeec <- orangeec %>%
  mutate(Crecimiento_GDP = ifelse(GDP.Growth.. >=2.5,
                                  "2.5% o mas",
                                  "menos de 2.5%"))

orangeec <- orangeec %>%
  mutate(Anaranjados=ifelse(Creat.Ind...GDP >= 2.5,
                            "Mas anaranjados",
                            "Menos anaranjados"))

#ranking

orangeec %>%
  arrange(desc(Creat.Ind...GDP))

TopNaranjas <- orangeec %>%
  filter(Country %in% c("Mexico","Panama","Argentina",
                        "Colombia","Brazil"))

TopNaranjas %>%
  arrange(desc(Creat.Ind...GDP))```

Hola, cómo complemento

Función top_n
Permite realizar filtado

En este caso los 5 números más altos de la industria creativa

Top <- top_n(orangeec,5,Creat.Ind...GDP)

Para ver los últimos 5, los más bajos
Se usa el número negativo

Top <- top_n(orangeec,-5,Creat.Ind...GDP)

:u ya se va acabar el curso y yo aún siento que me falta un monton por aprender

Me ha gustado bastante el curso realmente es muy completo y el articulo de sonia me motivo bastante

#orangeec

orangeec <- orangeec %>%
  mutate(Crecimiento_GDP = ifelse(GDP.Growth.. >= 2.5,
                                  "2.5 % ó más",
                                  "Menos 2.5%"))

orangeec <- orangeec %>%
  mutate(Anaranjados = ifelse(Creat.Ind...GDP >= 2.5,
                              "Mas anaranjados",
                              "Menos anaranjados"))

orangeec %>%
  arrange(desc(Creat.Ind...GDP))

TopNaranjas <- orangeec %>%
  filter(Country %in% c('Mexico','Panama', 'Argentina','Colombia','Brazil'))

TopNaranjas

TopNaranjas %>% 
  arrange(desc(Creat.Ind...GDP))

PARA LLEGAR A LO + TOP:
.
.

1.- Vision global #ranking de los paises que MÀS aportan al PIB desde sus Creative Industries

.
.

2.- El TOP 5 sin orden de los paises que MÀS aportan al PIB desde sus Creative Industries

.
.

3.- LO + TOP con orden descendente de los paises que MÀS aportan al PIB desde sus Creative Industries

desc() orden que tendran los datos de la variable en el ranking solicitado

Tip: con ctrl + f activan la funcion de busqueda de R studio, tambien sirve para reemplzar palabras.

Yo lo hice así:

#Ranking USO DE ORDENAMIENTOS (ARRANGE)
orangeec %>% 
  arrange(desc(Creat.Ind...GDP))
  
Ranking <- orangeec %>% 
  arrange(desc(Creat.Ind...GDP))

Ranking <- my_df[1:5,]

%in% quiere decir que va a buscar las etiquetas establecidas en el c() para la variable filtrada que es Country

Reto: la varaible de peso se categorizara por rangos

interesante!

El Ranking que hizo la profesora está acotado solamente a los países que colocó en el filtro, al usar top_n no estamos filtrando nada sino haciendo un ranking con todas las observaciones.

Bastante interesante el poder agregar nuevas variables al dataset a medida que se avanza en el análisis.

Se puede hacer en una sola sentencia ambos comandos:

topNaranja <- orangeec %>%
  filter(Country %in% c("Mexico","Panama","Argentina",
                        "Colombia","Brazil"))%>%
  arrange(desc(AporteEcNja))

Yo organicé ese ranking así, mostrando los 10 primeros países y sólo las variables de país y aporte de la economía naranja

orangeec %>% 
  arrange(desc(Creat.Ind...GDP)) %>% 
  select(1,6) %>% 
  head(10)

Hola, acá una forma más sencilla de poder seleccionar los top de manera descendente

TopNaranjas %>% 
slice_max(Creat.Ind...GDP, n = 5)

Error: Length of ordering vectors don’t match data frame size

tengo este error en el arrange descendiente