Otra alternativa para hacer la tabla con los top es usar la funcion ‘top_n’ :
DatasetNuevo <- top_n(dataset,cantidad_datos, variable)
ej:
## Tabla con top_n -Topnaranjas-
TopNaranjas <- top_n(orangeec,3,Creat.Ind...GDP )```
Bienvenida e introducción
Todo lo que aprenderás sobre el lenguaje R
Programación y Data Science
R y proyecto economía naranja.
Instalando nuestras herramientas
Variables, tipos de datos y estructuras
Los primeros cálculos con R y variables
Tipos de datos
Estructura del dataset del proyecto
Vectores
Matrices
Ejercicios con matrices
Operadores para comparar y ubicar datos
Factores, listas y echar un vistazo al dataset
EDA: Exploratory data analysis
Qué es EDA: Exploratory Data Analysis
Gráficas de dispersión e histogramas.
Box Plot y su interpretación
EDA con dataset proyecto - Gráficas de dispersión.
EDA con histogramas.
EDA con dataset proyecto - histogramas - ggplot2
EDA con box plot- ggplot2
EDA con dataset proyecto - box plot- ggplot2 - dplyr
EDA con gráficas de dispersión con más de dos variables - ggplot2
EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly
La estadística de los datos
Buscando correlaciones con pairs
Confirmando correlaciones con la función cor
Buscando correlaciones con pairs en dataset proyecto
Confirmando correlaciones con la función cor en dataset proyecto.
Protegiéndonos de los peligros del promedio.
Eliminando los NA's para hacer los cálculos.
Estadística y visualización aplicada a análisis de datos de mercadeo.
Ajustando los datos
Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1
Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2
Mejorando la visualización
Viendo más información con facet wrap - Parte 1
Viendo más información con facet wrap - Parte 2
Organizar visualizaciones y código con R Markdown
Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.
Conclusiones Finales
Invitación a continuar recorriendo el mundo del data science.
Aún no tienes acceso a esta clase
Crea una cuenta y continúa viendo este curso
Aportes 20
Preguntas 1
Otra alternativa para hacer la tabla con los top es usar la funcion ‘top_n’ :
DatasetNuevo <- top_n(dataset,cantidad_datos, variable)
ej:
## Tabla con top_n -Topnaranjas-
TopNaranjas <- top_n(orangeec,3,Creat.Ind...GDP )```
Todos dejan su forma de sacar los topNaranjas yo dejo la mia:
TopOrange <- head(orangeec %>% arrange(desc(Creat.Ind...GDP)))
TopOrange
Hola compañeros. Otra forma de realizar el ejercicio de Ranking.
top <-top_n(orangeec,5,Creat.Ind...GDP)[,]
top <- top %>% arrange(desc(top$Creat.Ind...GDP))
Saludos
##Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2
orangeec <- orangeec %>%
mutate(Crecimiento_GDP = ifelse(GDP.Growth.. >=2.5,
"2.5% o mas",
"menos de 2.5%"))
orangeec <- orangeec %>%
mutate(Anaranjados=ifelse(Creat.Ind...GDP >= 2.5,
"Mas anaranjados",
"Menos anaranjados"))
#ranking
orangeec %>%
arrange(desc(Creat.Ind...GDP))
TopNaranjas <- orangeec %>%
filter(Country %in% c("Mexico","Panama","Argentina",
"Colombia","Brazil"))
TopNaranjas %>%
arrange(desc(Creat.Ind...GDP))```
Hola, cómo complemento
Función top_n
Permite realizar filtado
En este caso los 5 números más altos de la industria creativa
Top <- top_n(orangeec,5,Creat.Ind...GDP)
Para ver los últimos 5, los más bajos
Se usa el número negativo
Top <- top_n(orangeec,-5,Creat.Ind...GDP)
:u ya se va acabar el curso y yo aún siento que me falta un monton por aprender
Me ha gustado bastante el curso realmente es muy completo y el articulo de sonia me motivo bastante
#orangeec
orangeec <- orangeec %>%
mutate(Crecimiento_GDP = ifelse(GDP.Growth.. >= 2.5,
"2.5 % ó más",
"Menos 2.5%"))
orangeec <- orangeec %>%
mutate(Anaranjados = ifelse(Creat.Ind...GDP >= 2.5,
"Mas anaranjados",
"Menos anaranjados"))
orangeec %>%
arrange(desc(Creat.Ind...GDP))
TopNaranjas <- orangeec %>%
filter(Country %in% c('Mexico','Panama', 'Argentina','Colombia','Brazil'))
TopNaranjas
TopNaranjas %>%
arrange(desc(Creat.Ind...GDP))
PARA LLEGAR A LO + TOP:
.
.
1.- Vision global #ranking de los paises que MÀS aportan al PIB desde sus Creative Industries
.
.
2.- El TOP 5 sin orden de los paises que MÀS aportan al PIB desde sus Creative Industries
.
.
3.- LO + TOP con orden descendente de los paises que MÀS aportan al PIB desde sus Creative Industries
desc() orden que tendran los datos de la variable en el ranking solicitado
Tip: con ctrl + f activan la funcion de busqueda de R studio, tambien sirve para reemplzar palabras.
Yo lo hice así:
#Ranking USO DE ORDENAMIENTOS (ARRANGE)
orangeec %>%
arrange(desc(Creat.Ind...GDP))
Ranking <- orangeec %>%
arrange(desc(Creat.Ind...GDP))
Ranking <- my_df[1:5,]
%in% quiere decir que va a buscar las etiquetas establecidas en el c() para la variable filtrada que es Country
Reto: la varaible de peso se categorizara por rangos
interesante!
El Ranking que hizo la profesora está acotado solamente a los países que colocó en el filtro, al usar top_n no estamos filtrando nada sino haciendo un ranking con todas las observaciones.
Bastante interesante el poder agregar nuevas variables al dataset a medida que se avanza en el análisis.
Se puede hacer en una sola sentencia ambos comandos:
topNaranja <- orangeec %>%
filter(Country %in% c("Mexico","Panama","Argentina",
"Colombia","Brazil"))%>%
arrange(desc(AporteEcNja))
Yo organicé ese ranking así, mostrando los 10 primeros países y sólo las variables de país y aporte de la economía naranja
orangeec %>%
arrange(desc(Creat.Ind...GDP)) %>%
select(1,6) %>%
head(10)
Hola, acá una forma más sencilla de poder seleccionar los top de manera descendente
TopNaranjas %>%
slice_max(Creat.Ind...GDP, n = 5)
Error: Length of ordering vectors don’t match data frame size
tengo este error en el arrange descendiente
¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.