Bienvenida e introducci贸n

1

Todo lo que aprender谩s sobre el lenguaje R

2

Programaci贸n y Data Science

3

R y proyecto econom铆a naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros c谩lculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qu茅 es EDA: Exploratory Data Analysis

14

Gr谩ficas de dispersi贸n e histogramas.

15

Box Plot y su interpretaci贸n

16

EDA con dataset proyecto - Gr谩ficas de dispersi贸n.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gr谩ficas de dispersi贸n con m谩s de dos variables - ggplot2

22

EDA con dataset proyecto usando gr谩ficas de dispersi贸n con m谩s de dos variables - ggplot2 - plotly

La estad铆stica de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la funci贸n cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la funci贸n cor en dataset proyecto.

27

Protegi茅ndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los c谩lculos.

29

Estad铆stica y visualizaci贸n aplicada a an谩lisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualizaci贸n

32

Viendo m谩s informaci贸n con facet wrap - Parte 1

33

Viendo m谩s informaci贸n con facet wrap - Parte 2

Organizar visualizaciones y c贸digo con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del an谩lisis en un documento PDF.

Conclusiones Finales

35

Invitaci贸n a continuar recorriendo el mundo del data science.

No tienes acceso a esta clase

隆Contin煤a aprendiendo! 脷nete y comienza a potenciar tu carrera

Conociendo R Markdown y organizando los hallazgos del an谩lisis en un documento PDF.

34/35
Recursos

Es momento de generar nuestro documento con todas las gr谩ficas y observaciones que hemos realizado a nuestro dataset, para ello necesitamos instalar el paquete rmarkdown: install.packages(鈥渞markdown鈥).

R Markdown nos permite generar archivos en formato HTML, PDF y Word. La mejor opci贸n es trabajar en un formato HTML para compartirlo por internet y posteriormente convertirlo ya sea a PDF o Word.

Dentro de nuestro archivo de R Markdown iremos escribiendo con sintaxis de markdown el archivo y cuando escribamos c贸digo por si solo se va a ejecutar y a帽adir las gr谩ficas o c谩lculos a nuestro archivo.

Aportes 30

Preguntas 17

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad?

o inicia sesi贸n.

Para introducir un chunk r谩pidamente podemos usar la combinaci贸n de teclas ctrl + alt + i Control, alt y la letra i Es una belleza Saludos

Por ac谩 dejo mi c贸digo, yo lo export茅 en los tres formatos html, pdf y docx. Es necesario que cambien el simbolo (鈥) por (`) ya que de otro modo no me lo dejaba subir aqu铆.

---
title: "Economia Naranja"
author: "Cosme Fulanito"
date: "22-jan-2020"
output: html_document
---

## Generacion de archivos PDF (pdf_document), DOCX(word_document) y HTML (html_document) con R-MARKDOWN
### Comandos para instalar y ejecutar archivo *.rmd
- install.packages("rmarkdown")
- library(rmarkdown)
- install.packages("knitr")
- library(knitr)
- rmarkdown::render('class25.rmd')

蹋蹋蹋'''{r}
orangeec = read.csv(file="orangeec.csv", header=TRUE, sep=",")
蹋蹋蹋'''
蹋蹋蹋'''{r}
summary(orangeec)
蹋蹋蹋'''

### Parece que hay correlacion entre aporte de economia naranja al PIB y la tasa de desempleo.

蹋蹋蹋'''{r}
pairs(orangeec[,6:10])
蹋蹋蹋'''
蹋蹋蹋'''{r}
library(ggplot2)
蹋蹋蹋'''
蹋蹋蹋'''{r}
ggplot()+geom_histogram(data=orangeec,aes(x=orangeec$Internet.penetration...population),
    fill="lightblue",color="darkblue",binwidth=5)+
labs(x="Penetraci贸n de Internet (%) poblaci贸n", y="Cantidad de Paises", 
    title="Penetraci贸n de Internet en LATAM")+
scale_x_continuous(breaks=seq(38, max(96), 2))+
theme(legend.position="none")+
theme(panel.background=element_blank(), 
    panel.grid.major=element_blank(), panel.grid.minor=element_blank())
蹋蹋蹋'''
蹋蹋蹋'''{r}
library(dplyr)
蹋蹋蹋'''
蹋蹋蹋'''{r}
mean <- mean(orangeec$GDP.PC)
蹋蹋蹋'''
蹋蹋蹋'''{r}
orangeec <- orangeec %>% mutate(strongEconomy = ifelse(GDP.PC < mean, 
    "Por debajo del promedio PIB", "Por encima del promedio PIB"))
蹋蹋蹋'''
蹋蹋蹋'''{r}
ggplot(orangeec, aes(x=strongEconomy, y=Creat.Ind...GDP, fill=strongEconomy))+
geom_boxplot(alpha=0.4)+
labs(x="Tipo de Pa铆s", y="Aporte Econom铆a Naranja al PIB", 
    title="Aporte Econom铆a Naranja en PIB en LATAM con alto y bajo PIB per c谩pita")
蹋蹋蹋'''

### El boxplot indica que los paises por encima del promedio del PIB tienen una dispersi贸n mucho mas alta en relaci贸n a los aportes de la econom铆a naranja al PIB del pa铆s. CUIDADO, contrastar con desviaci贸n est谩ndar.

html

pdf

Hay un peque帽o error en el minuto 15:51 y es que ese link es una ruta de acceso local y no una URL por lo tanto no sirve para compartir el documento

Hola a todos. Quisiera anotar que, por est茅tica y para facilitar la comunicaci贸n de nuestros hallazgos, considero importante ocultar en los chunk la sintaxis del c贸digo. Para esto usamos {r, echo=false} y de esta forma se ejecuta nuestro codigo pero la sintaxis nos es visible.
Saludos!!

Para usuarios de windows
ponen en la consola de rstudio

file.choose()

te abre una ventana buscas el csv lo seleccionas y le sale la direcci贸n en la consola

lo saqu茅 de aqu铆 :v

**Para usuarios de Windows 10 ponen en consola el comando** ``` file.choose() ``` le abre una ventana para buscar el csv lo seleccionan y sale la direcci贸n en la consola lo copian y wala :v

<h3>Publica tu proyecto en Github Pages</h3>
  1. Asegurate que en tu repositorio local renombres el archivo .html como index.html y que la ubicacion del archivo este en la raiz del repositorio. Haz un push para subir tus cambios a Github 馃懆鈥嶐煉
  2. Dirigite a la seccion de Settings dirigete a Github Pages en _select branch _ escogemos master. Le damos a Save 馃憟

Ya con eso, si regresas Github Pages y en tu repositorio deberias visualizar tu proyecto deployado 馃槈 鈥

Por ultimo dejo mi repo por si alguien quiere coloborar, observaciones o notas que podriamos a帽adir 馃憖 鈥 Acepto sus Pull Request 鈫 Fudamentos de R

Quiero compartir un ejercicio donde puse en pr谩ctica los temas del curso y adem谩s sistematic茅 una depuraci贸n y an谩lisis de datos de mi cuenta de Uber Trips por medio de R Markdown, si te interesa explorar y conocer el comportamiento de tus gastos en Uber s贸lo debes clonarlo y correrlo, en el repo encontrar谩s c贸mo solicitar los datos de Uber y qu茅 hacer con ellos. 馃榿
Repo: https://github.com/Homerox710/Uber-Trips

PD: Esta l贸gica puedes utilizarla y aplicarla f谩cilmente a tus datos de Uber Eats tambi茅n, pr谩cticamente s贸lo cambian los nombres de las columnas, si te pareci贸 interesante o usas m谩s Uber Eats que Uber Trips, puedes intentarlo, ya que igual viene incluido en los datos que solicitas a Uber.

Tambi茅n pueden cargar sus datos de la siguiente forma:

file- import dataset- from text(readr).

Buscan el archivo que quieren poner en r y copian el code preview, lo poenen en {r} y listo.

Ejemplo:
library(readr)
orangeec <-read_csv(鈥淐:/Users/L/Desktop/Curso fundamentos R/orangeec.csv鈥)



Por si alguien m谩s tuvo el mimo problema, aqu铆 comparto mi soluci贸n. No me dejaba ejecutar pairs ni el segundo gr谩fico. summary no se me visualizaba con la informaci贸n que deber铆a.

orangeec <- read.csv("C:/Users/manut/Google Drive/Platzi/Cursos/Escuelas/Ciencia de Datos/R/Fundamentos/Data/orangeec.csv", encoding="UTF-8", stringsAsFactors=TRUE, sep = ",")

Al leer el archivo me tra铆a un error por no considerar la coma como separador, por lo que tuve que pasarlo como atributo en la funci贸n read.csv

Al igual, data(orangeec) tuve que eliminarlo ya que me arrojaba el siguiente error

##Warning message:
In data(orangeec) : data set 鈥榦rangeec鈥 not found

Pues es mucho m谩s f谩cil en Python con los Notebooks.

Wow!!!
Que curso mas genial!!!
Ya me imagino un curso avanzado de R!!

MARKDOWN

Me manda error al ejecutar la linea donde lee el csv

<code>
```{r}
orangeec <- read.csv("desktop/R/orangeec.csv")
data(orangeec)
summary(orangeec)

</code>


Error in file(file, "rt") : cannot open the connection
Calls: <Anonymous> ... withVisible -> eval -> eval -> read.csv -> read.table -> file
Execution halted

Podemos jugar con el tama帽o de los t铆tulos a帽adiendo diferentes cantidades de # al comienzo de cada linea.

file:///Users/edrcedano/Downloads/Orange-Economy-master/EconomiaNaranjaRMRKDW.html

No reproduce el video

Para los que tengan problema al darle 鈥淧ublish鈥 y le salga que deben actualizar cierto paquetes y le den error, aqui esta la solucion:

Ubuntu 16.04/18.04/20.04
sudo apt-get install libcurl4-openssl-dev r-base

Muy interesante el curso, ayuda mucho al que recien empieza con Data Science

interesante!

No puedo realizar este paso me aparece un error en la lectura del c贸digo de ubicaci贸n del archivo鈥lguien por favor me puede ayudar; mi sistema operativo es windows 10

orangeec <- read.csv(Por la ubicacion del archivo no me permite continuar con el proceso)
data(orangeec)
summary(orangeec)

Esta herramienta es super util a la hora de de publicar nuestros documentos

---
title: "Economia Naranja"
author: "Edwin Barrientos"
date: "21/3/2020"
output: html_document
---
```{r}
orangeec <- read.csv("D:/Dropbox/Fundamentos de R/orangeec.csv")
data(orangeec)
summary(orangeec)

Parece que hay correlacion entre aporte de economia naranja al pib y la tasa de desempleo

pairs(orangeec[,6:10])
library(ggplot2)
ggplot()+geom_histogram(data=orangeec,
                        aes(x=Internet.penetration...population),fill='red',color='yellow',
                        binwidth=5)+
  labs(x="Penetracion internet(%)pobllacion", y="Cantidad de paises",
       title="Penetracion de internet en paises latam")+
  theme(legend.position = 'none')+
  theme(panel.background = element_blank(),panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())
library(dplyr)
economy <- mean(orangeec$GDP.PC)
economy
orangec <-orangeec %>%
  mutate(Strong_economy = ifelse(GDP.PC < economy,
                                 "Por debajo promedio pib per capita",
                                 "Sobre-Arriba promedio pib per capita"))
ggplot(orangec, aes(x=Strong_economy, y=Creat.Ind...GDP,
                    fill=Strong_economy))+
  geom_boxplot(alpha=0.4)+
  labs(c="Tipo de pais", y="Aporte economia naranja al pib",
       title="Aporte economia naranja en pib paises latam con
       alto y bajo pib per capita")+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())

El boxplot indica que los paises sobre el promedio en pib per capita tienen una dispersion mucho mas alta en cuanto a los aportes de la economia naranja al pib del pais. OJO confirmar con desviacion estandar.

Excelente manera de documentar todo lo que hemos jugado con R!

Supremamente 煤til esta clase.

Interesante, me imagino que tambien se podria colocar partes de codigo html en los comentarios, luego lo intentare. Muy interesante forma de compartir un proyecto.

Buenas tardes
min 5:00
Me sale "El sistema no puede encontrar el archivo especificado"
Le estoy especificando la ruta del archivo orangeec.csv el cual est谩 en mi escritorio (/Escritorio/Orangeec.csv) y ni as铆 me deja proceder.
Ayuda por favor

---
title: "Economia Naranja"
author: "Javier Santiago Salgado"
date: "8/1/2021"
output: html_document
---

```{r}
orangeec <- read.csv("orangeec.csv")
data(orangeec)
summary(orangeec)
Parece que hay correlaci贸n entre aporte de econom铆a naranja al PIB y el desempleo
```{r} 
pairs(orangeec[, 6:10])
```

```{r}
library(ggplot2)
```
```{r}
ggplot() + geom_histogram(data=orangeec,
                          aes(x=Internet.penetration...population), fill = 'red', color = 'yellow',
                          binwidth = 5)+
  labs(x='Penetraci贸n Internet (%) Poblaci贸n',
       y='Cantidad de paises',
       title= 'Penetraci贸n de Internet en paises latam')+
  scale_x_continuous(breaks = seq(40,max(100),5))+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())
```
```{r}
library(dplyr)
```
```{r}
economy <- mean(orangeec$GDP.PC)
economy
```
```{r}
orangeec <- orangeec %>%
  mutate(Strong_economy = ifelse(GDP.PC < economy,
                                 "Por debajo promedio PIB per c谩pita",
                                 "Sobre Arriba promedio PIB per c谩pita"))

```
```{r}
ggplot(orangeec,aes(x=Strong_economy,y=Creat.Ind...GDP, fill=Strong_economy))+
  geom_boxplot(alpha = 0.4)+
  labs(x='Tipo de pa铆s',
       y='Aporte economia naranja al PIB',
       title = 'Aporte economia naranja al PIB paises latam con alto y bajo PIB per capita')+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())


```
El boxplot indica que los paises sobre el promedio en PIB Per C谩pita, tienen una dispersion m谩s alta.Se requiere confirmaci贸n con desviaci贸n estandar.


隆Hola comunidad!, tengo problemas con los acentos, al 鈥渒nitearlo鈥 simplemente remueve las vocales acentuadas. 驴Alguna idea de por qu茅 esto ocurre?, 驴ser谩 por el tipo de extensi贸n UTF-8 en que he guardado el archivo html?, algo importante es que trabajo desde una Mac.