Bienvenida e introducción
Todo lo que aprenderás sobre el lenguaje R
Programación y Data Science
R y proyecto economía naranja.
Instalando nuestras herramientas
Variables, tipos de datos y estructuras
Los primeros cálculos con R y variables
Tipos de datos
Estructura del dataset del proyecto
Vectores
Matrices
Ejercicios con matrices
Operadores para comparar y ubicar datos
Factores, listas y echar un vistazo al dataset
EDA: Exploratory data analysis
Qué es EDA: Exploratory Data Analysis
Gráficas de dispersión e histogramas.
Box Plot y su interpretación
EDA con dataset proyecto - Gráficas de dispersión.
EDA con histogramas.
EDA con dataset proyecto - histogramas - ggplot2
EDA con box plot- ggplot2
EDA con dataset proyecto - box plot- ggplot2 - dplyr
EDA con gráficas de dispersión con más de dos variables - ggplot2
EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly
La estadística de los datos
Buscando correlaciones con pairs
Confirmando correlaciones con la función cor
Buscando correlaciones con pairs en dataset proyecto
Confirmando correlaciones con la función cor en dataset proyecto.
Protegiéndonos de los peligros del promedio.
Eliminando los NA's para hacer los cálculos.
Estadística y visualización aplicada a análisis de datos de mercadeo.
Ajustando los datos
Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1
Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2
Mejorando la visualización
Viendo más información con facet wrap - Parte 1
Viendo más información con facet wrap - Parte 2
Organizar visualizaciones y código con R Markdown
Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.
Conclusiones Finales
Invitación a continuar recorriendo el mundo del data science.
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
No se trata de lo que quieres comprar, sino de quién quieres ser. Aprovecha el precio especial.
Antes: $249
Paga en 4 cuotas sin intereses
Termina en:
Sonia Ardila
Es momento de generar nuestro documento con todas las gráficas y observaciones que hemos realizado a nuestro dataset, para ello necesitamos instalar el paquete rmarkdown
: install.packages(“rmarkdown”)
.
R Markdown nos permite generar archivos en formato HTML, PDF y Word. La mejor opción es trabajar en un formato HTML para compartirlo por internet y posteriormente convertirlo ya sea a PDF o Word.
Dentro de nuestro archivo de R Markdown iremos escribiendo con sintaxis de markdown el archivo y cuando escribamos código por si solo se va a ejecutar y añadir las gráficas o cálculos a nuestro archivo.
Aportes 31
Preguntas 18
Por acá dejo mi código, yo lo exporté en los tres formatos html, pdf y docx. Es necesario que cambien el simbolo (’) por (`) ya que de otro modo no me lo dejaba subir aquí.
---
title: "Economia Naranja"
author: "Cosme Fulanito"
date: "22-jan-2020"
output: html_document
---
## Generacion de archivos PDF (pdf_document), DOCX(word_document) y HTML (html_document) con R-MARKDOWN
### Comandos para instalar y ejecutar archivo *.rmd
- install.packages("rmarkdown")
- library(rmarkdown)
- install.packages("knitr")
- library(knitr)
- rmarkdown::render('class25.rmd')
̣̣̣'''{r}
orangeec = read.csv(file="orangeec.csv", header=TRUE, sep=",")
̣̣̣'''
̣̣̣'''{r}
summary(orangeec)
̣̣̣'''
### Parece que hay correlacion entre aporte de economia naranja al PIB y la tasa de desempleo.
̣̣̣'''{r}
pairs(orangeec[,6:10])
̣̣̣'''
̣̣̣'''{r}
library(ggplot2)
̣̣̣'''
̣̣̣'''{r}
ggplot()+geom_histogram(data=orangeec,aes(x=orangeec$Internet.penetration...population),
fill="lightblue",color="darkblue",binwidth=5)+
labs(x="Penetración de Internet (%) población", y="Cantidad de Paises",
title="Penetración de Internet en LATAM")+
scale_x_continuous(breaks=seq(38, max(96), 2))+
theme(legend.position="none")+
theme(panel.background=element_blank(),
panel.grid.major=element_blank(), panel.grid.minor=element_blank())
̣̣̣'''
̣̣̣'''{r}
library(dplyr)
̣̣̣'''
̣̣̣'''{r}
mean <- mean(orangeec$GDP.PC)
̣̣̣'''
̣̣̣'''{r}
orangeec <- orangeec %>% mutate(strongEconomy = ifelse(GDP.PC < mean,
"Por debajo del promedio PIB", "Por encima del promedio PIB"))
̣̣̣'''
̣̣̣'''{r}
ggplot(orangeec, aes(x=strongEconomy, y=Creat.Ind...GDP, fill=strongEconomy))+
geom_boxplot(alpha=0.4)+
labs(x="Tipo de País", y="Aporte Economía Naranja al PIB",
title="Aporte Economía Naranja en PIB en LATAM con alto y bajo PIB per cápita")
̣̣̣'''
### El boxplot indica que los paises por encima del promedio del PIB tienen una dispersión mucho mas alta en relación a los aportes de la economía naranja al PIB del país. CUIDADO, contrastar con desviación estándar.
html
pdf
Hay un pequeño error en el minuto 15:51 y es que ese link es una ruta de acceso local y no una URL por lo tanto no sirve para compartir el documento
Hola a todos. Quisiera anotar que, por estética y para facilitar la comunicación de nuestros hallazgos, considero importante ocultar en los chunk la sintaxis del código. Para esto usamos {r, echo=false} y de esta forma se ejecuta nuestro codigo pero la sintaxis nos es visible.
Saludos!!
**Para usuarios de Windows 10 ponen en consola el comando** ``` file.choose() ``` le abre una ventana para buscar el csv lo seleccionan y sale la dirección en la consola lo copian y wala :v
Ya con eso, si regresas Github Pages y en tu repositorio deberias visualizar tu proyecto deployado 😉 …
Por ultimo dejo mi repo por si alguien quiere coloborar, observaciones o notas que podriamos añadir 👀 … Acepto sus Pull Request → Fudamentos de R
También pueden cargar sus datos de la siguiente forma:
file- import dataset- from text(readr).
Buscan el archivo que quieren poner en r y copian el code preview, lo poenen en {r}
y listo.
Ejemplo:
library(readr)
orangeec <-read_csv(“C:/Users/L/Desktop/Curso fundamentos R/orangeec.csv”)
Podemos jugar con el tamaño de los títulos añadiendo diferentes cantidades de # al comienzo de cada linea.
Por si alguien más tuvo el mimo problema, aquí comparto mi solución. No me dejaba ejecutar pairs ni el segundo gráfico. summary no se me visualizaba con la información que debería.
orangeec <- read.csv("C:/Users/manut/Google Drive/Platzi/Cursos/Escuelas/Ciencia de Datos/R/Fundamentos/Data/orangeec.csv", encoding="UTF-8", stringsAsFactors=TRUE, sep = ",")
Al leer el archivo me traía un error por no considerar la coma como separador, por lo que tuve que pasarlo como atributo en la función read.csv
Al igual, data(orangeec) tuve que eliminarlo ya que me arrojaba el siguiente error
##Warning message:
In data(orangeec) : data set ‘orangeec’ not found
---
title: "Economia Naranja"
author: "Edwin Barrientos"
date: "21/3/2020"
output: html_document
---
```{r}
orangeec <- read.csv("D:/Dropbox/Fundamentos de R/orangeec.csv")
data(orangeec)
summary(orangeec)
Parece que hay correlacion entre aporte de economia naranja al pib y la tasa de desempleo
pairs(orangeec[,6:10])
library(ggplot2)
ggplot()+geom_histogram(data=orangeec,
aes(x=Internet.penetration...population),fill='red',color='yellow',
binwidth=5)+
labs(x="Penetracion internet(%)pobllacion", y="Cantidad de paises",
title="Penetracion de internet en paises latam")+
theme(legend.position = 'none')+
theme(panel.background = element_blank(),panel.grid.major = element_blank(),
panel.grid.minor = element_blank())
library(dplyr)
economy <- mean(orangeec$GDP.PC)
economy
orangec <-orangeec %>%
mutate(Strong_economy = ifelse(GDP.PC < economy,
"Por debajo promedio pib per capita",
"Sobre-Arriba promedio pib per capita"))
ggplot(orangec, aes(x=Strong_economy, y=Creat.Ind...GDP,
fill=Strong_economy))+
geom_boxplot(alpha=0.4)+
labs(c="Tipo de pais", y="Aporte economia naranja al pib",
title="Aporte economia naranja en pib paises latam con
alto y bajo pib per capita")+
theme(legend.position = "none")+
theme(panel.background = element_blank(),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank())
El boxplot indica que los paises sobre el promedio en pib per capita tienen una dispersion mucho mas alta en cuanto a los aportes de la economia naranja al pib del pais. OJO confirmar con desviacion estandar.
Pues es mucho más fácil en Python con los Notebooks.
Wow!!!
Que curso mas genial!!!
Ya me imagino un curso avanzado de R!!
MARKDOWN
Me manda error al ejecutar la linea donde lee el csv
<code>
```{r}
orangeec <- read.csv("desktop/R/orangeec.csv")
data(orangeec)
summary(orangeec)
</code>
Error in file(file, "rt") : cannot open the connection
Calls: <Anonymous> ... withVisible -> eval -> eval -> read.csv -> read.table -> file
Execution halted
file:///Users/edrcedano/Downloads/Orange-Economy-master/EconomiaNaranjaRMRKDW.html
Hola aqui dejo un enlace para complementar la clase https://bookdown.org/gboccardo/manual-ED-UCH/introduccion-al-uso-de-rmarkdown-para-la-compilacion-de-resultados-de-rstudio-en-diferentes-formatos.html#que-es-rmarkdown-y-para-que-sirve
No reproduce el video
Para los que tengan problema al darle “Publish” y le salga que deben actualizar cierto paquetes y le den error, aqui esta la solucion:
Ubuntu 16.04/18.04/20.04
sudo apt-get install libcurl4-openssl-dev r-base
Muy interesante el curso, ayuda mucho al que recien empieza con Data Science
interesante!
No puedo realizar este paso me aparece un error en la lectura del código de ubicación del archivo…alguien por favor me puede ayudar; mi sistema operativo es windows 10
orangeec <- read.csv(Por la ubicacion del archivo no me permite continuar con el proceso)
data(orangeec)
summary(orangeec)
Esta herramienta es super util a la hora de de publicar nuestros documentos
Excelente manera de documentar todo lo que hemos jugado con R!
Supremamente útil esta clase.
Interesante, me imagino que tambien se podria colocar partes de codigo html en los comentarios, luego lo intentare. Muy interesante forma de compartir un proyecto.
Buenas tardes
min 5:00
Me sale "El sistema no puede encontrar el archivo especificado"
Le estoy especificando la ruta del archivo orangeec.csv el cual está en mi escritorio (/Escritorio/Orangeec.csv) y ni así me deja proceder.
Ayuda por favor
---
title: "Economia Naranja"
author: "Javier Santiago Salgado"
date: "8/1/2021"
output: html_document
---
```{r}
orangeec <- read.csv("orangeec.csv")
data(orangeec)
summary(orangeec)
Parece que hay correlación entre aporte de economía naranja al PIB y el desempleo
```{r}
pairs(orangeec[, 6:10])
```
```{r}
library(ggplot2)
```
```{r}
ggplot() + geom_histogram(data=orangeec,
aes(x=Internet.penetration...population), fill = 'red', color = 'yellow',
binwidth = 5)+
labs(x='Penetración Internet (%) Población',
y='Cantidad de paises',
title= 'Penetración de Internet en paises latam')+
scale_x_continuous(breaks = seq(40,max(100),5))+
theme(legend.position = "none")+
theme(panel.background = element_blank(),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank())
```
```{r}
library(dplyr)
```
```{r}
economy <- mean(orangeec$GDP.PC)
economy
```
```{r}
orangeec <- orangeec %>%
mutate(Strong_economy = ifelse(GDP.PC < economy,
"Por debajo promedio PIB per cápita",
"Sobre Arriba promedio PIB per cápita"))
```
```{r}
ggplot(orangeec,aes(x=Strong_economy,y=Creat.Ind...GDP, fill=Strong_economy))+
geom_boxplot(alpha = 0.4)+
labs(x='Tipo de país',
y='Aporte economia naranja al PIB',
title = 'Aporte economia naranja al PIB paises latam con alto y bajo PIB per capita')+
theme(legend.position = "none")+
theme(panel.background = element_blank(),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank())
```
El boxplot indica que los paises sobre el promedio en PIB Per Cápita, tienen una dispersion más alta.Se requiere confirmación con desviación estandar.
¡Hola comunidad!, tengo problemas con los acentos, al “knitearlo” simplemente remueve las vocales acentuadas. ¿Alguna idea de por qué esto ocurre?, ¿será por el tipo de extensión UTF-8 en que he guardado el archivo html?, algo importante es que trabajo desde una Mac.
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?