Bienvenida e introducción

1

Todo lo que aprenderás sobre el lenguaje R

2

Programación y Data Science

3

R y proyecto economía naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros cálculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qué es EDA: Exploratory Data Analysis

14

Gráficas de dispersión e histogramas.

15

Box Plot y su interpretación

16

EDA con dataset proyecto - Gráficas de dispersión.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gráficas de dispersión con más de dos variables - ggplot2

22

EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly

La estadística de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la función cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la función cor en dataset proyecto.

27

Protegiéndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los cálculos.

29

Estadística y visualización aplicada a análisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualización

32

Viendo más información con facet wrap - Parte 1

33

Viendo más información con facet wrap - Parte 2

Organizar visualizaciones y código con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.

Conclusiones Finales

35

Invitación a continuar recorriendo el mundo del data science.

Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.

34/35
Recursos

Es momento de generar nuestro documento con todas las gráficas y observaciones que hemos realizado a nuestro dataset, para ello necesitamos instalar el paquete rmarkdown: install.packages(“rmarkdown”).

R Markdown nos permite generar archivos en formato HTML, PDF y Word. La mejor opción es trabajar en un formato HTML para compartirlo por internet y posteriormente convertirlo ya sea a PDF o Word.

Dentro de nuestro archivo de R Markdown iremos escribiendo con sintaxis de markdown el archivo y cuando escribamos código por si solo se va a ejecutar y añadir las gráficas o cálculos a nuestro archivo.

Aportes 30

Preguntas 10

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Para introducir un chunk rápidamente podemos usar la combinación de teclas ctrl + alt + i Control, alt y la letra i Es una belleza Saludos

Por acá dejo mi código, yo lo exporté en los tres formatos html, pdf y docx. Es necesario que cambien el simbolo (’) por (`) ya que de otro modo no me lo dejaba subir aquí.

---
title: "Economia Naranja"
author: "Cosme Fulanito"
date: "22-jan-2020"
output: html_document
---

## Generacion de archivos PDF (pdf_document), DOCX(word_document) y HTML (html_document) con R-MARKDOWN
### Comandos para instalar y ejecutar archivo *.rmd
- install.packages("rmarkdown")
- library(rmarkdown)
- install.packages("knitr")
- library(knitr)
- rmarkdown::render('class25.rmd')

̣̣̣'''{r}
orangeec = read.csv(file="orangeec.csv", header=TRUE, sep=",")
̣̣̣'''
̣̣̣'''{r}
summary(orangeec)
̣̣̣'''

### Parece que hay correlacion entre aporte de economia naranja al PIB y la tasa de desempleo.

̣̣̣'''{r}
pairs(orangeec[,6:10])
̣̣̣'''
̣̣̣'''{r}
library(ggplot2)
̣̣̣'''
̣̣̣'''{r}
ggplot()+geom_histogram(data=orangeec,aes(x=orangeec$Internet.penetration...population),
    fill="lightblue",color="darkblue",binwidth=5)+
labs(x="Penetración de Internet (%) población", y="Cantidad de Paises", 
    title="Penetración de Internet en LATAM")+
scale_x_continuous(breaks=seq(38, max(96), 2))+
theme(legend.position="none")+
theme(panel.background=element_blank(), 
    panel.grid.major=element_blank(), panel.grid.minor=element_blank())
̣̣̣'''
̣̣̣'''{r}
library(dplyr)
̣̣̣'''
̣̣̣'''{r}
mean <- mean(orangeec$GDP.PC)
̣̣̣'''
̣̣̣'''{r}
orangeec <- orangeec %>% mutate(strongEconomy = ifelse(GDP.PC < mean, 
    "Por debajo del promedio PIB", "Por encima del promedio PIB"))
̣̣̣'''
̣̣̣'''{r}
ggplot(orangeec, aes(x=strongEconomy, y=Creat.Ind...GDP, fill=strongEconomy))+
geom_boxplot(alpha=0.4)+
labs(x="Tipo de País", y="Aporte Economía Naranja al PIB", 
    title="Aporte Economía Naranja en PIB en LATAM con alto y bajo PIB per cápita")
̣̣̣'''

### El boxplot indica que los paises por encima del promedio del PIB tienen una dispersión mucho mas alta en relación a los aportes de la economía naranja al PIB del país. CUIDADO, contrastar con desviación estándar.

html

pdf

Hay un pequeño error en el minuto 15:51 y es que ese link es una ruta de acceso local y no una URL por lo tanto no sirve para compartir el documento

Hola a todos. Quisiera anotar que, por estética y para facilitar la comunicación de nuestros hallazgos, considero importante ocultar en los chunk la sintaxis del código. Para esto usamos {r, echo=false} y de esta forma se ejecuta nuestro codigo pero la sintaxis nos es visible.
Saludos!!

<h3>Publica tu proyecto en Github Pages</h3>
  1. Asegurate que en tu repositorio local renombres el archivo .html como index.html y que la ubicacion del archivo este en la raiz del repositorio. Haz un push para subir tus cambios a Github 👨‍💻
  2. Dirigite a la seccion de Settings dirigete a Github Pages en _select branch _ escogemos master. Le damos a Save 👈

Ya con eso, si regresas Github Pages y en tu repositorio deberias visualizar tu proyecto deployado 😉 …

Por ultimo dejo mi repo por si alguien quiere coloborar, observaciones o notas que podriamos añadir 👀 … Acepto sus Pull Request → Fudamentos de R

Por si alguien más tuvo el mimo problema, aquí comparto mi solución. No me dejaba ejecutar pairs ni el segundo gráfico. summary no se me visualizaba con la información que debería.

orangeec <- read.csv("C:/Users/manut/Google Drive/Platzi/Cursos/Escuelas/Ciencia de Datos/R/Fundamentos/Data/orangeec.csv", encoding="UTF-8", stringsAsFactors=TRUE, sep = ",")

Al leer el archivo me traía un error por no considerar la coma como separador, por lo que tuve que pasarlo como atributo en la función read.csv

Al igual, data(orangeec) tuve que eliminarlo ya que me arrojaba el siguiente error

##Warning message:
In data(orangeec) : data set ‘orangeec’ not found

Quiero compartir un ejercicio donde puse en práctica los temas del curso y además sistematicé una depuración y análisis de datos de mi cuenta de Uber Trips por medio de R Markdown, si te interesa explorar y conocer el comportamiento de tus gastos en Uber sólo debes clonarlo y correrlo, en el repo encontrarás cómo solicitar los datos de Uber y qué hacer con ellos. 😁
Repo: https://github.com/Homerox710/Uber-Trips

PD: Esta lógica puedes utilizarla y aplicarla fácilmente a tus datos de Uber Eats también, prácticamente sólo cambian los nombres de las columnas, si te pareció interesante o usas más Uber Eats que Uber Trips, puedes intentarlo, ya que igual viene incluido en los datos que solicitas a Uber.

También pueden cargar sus datos de la siguiente forma:

file- import dataset- from text(readr).

Buscan el archivo que quieren poner en r y copian el code preview, lo poenen en {r} y listo.

Ejemplo:
library(readr)
orangeec <-read_csv(“C:/Users/L/Desktop/Curso fundamentos R/orangeec.csv”)



Podemos jugar con el tamaño de los títulos añadiendo diferentes cantidades de # al comienzo de cada linea.

Me manda error al ejecutar la linea donde lee el csv

<code>
```{r}
orangeec <- read.csv("desktop/R/orangeec.csv")
data(orangeec)
summary(orangeec)

</code>


Error in file(file, "rt") : cannot open the connection
Calls: <Anonymous> ... withVisible -> eval -> eval -> read.csv -> read.table -> file
Execution halted

file:///Users/edrcedano/Downloads/Orange-Economy-master/EconomiaNaranjaRMRKDW.html

**Para usuarios de Windows 10 ponen en consola el comando** ``` file.choose() ``` le abre una ventana para buscar el csv lo seleccionan y sale la dirección en la consola lo copian y wala :v

Para usuarios de windows
ponen en la consola de rstudio

file.choose()

te abre una ventana buscas el csv lo seleccionas y le sale la dirección en la consola

lo saqué de aquí :v

MARKDOWN

No reproduce el video

Para los que tengan problema al darle “Publish” y le salga que deben actualizar cierto paquetes y le den error, aqui esta la solucion:

Ubuntu 16.04/18.04/20.04
sudo apt-get install libcurl4-openssl-dev r-base

Muy interesante el curso, ayuda mucho al que recien empieza con Data Science

interesante!

Wow!!!
Que curso mas genial!!!
Ya me imagino un curso avanzado de R!!

No puedo realizar este paso me aparece un error en la lectura del código de ubicación del archivo…alguien por favor me puede ayudar; mi sistema operativo es windows 10

orangeec <- read.csv(Por la ubicacion del archivo no me permite continuar con el proceso)
data(orangeec)
summary(orangeec)

Esta herramienta es super util a la hora de de publicar nuestros documentos

---
title: "Economia Naranja"
author: "Edwin Barrientos"
date: "21/3/2020"
output: html_document
---
```{r}
orangeec <- read.csv("D:/Dropbox/Fundamentos de R/orangeec.csv")
data(orangeec)
summary(orangeec)

Parece que hay correlacion entre aporte de economia naranja al pib y la tasa de desempleo

pairs(orangeec[,6:10])
library(ggplot2)
ggplot()+geom_histogram(data=orangeec,
                        aes(x=Internet.penetration...population),fill='red',color='yellow',
                        binwidth=5)+
  labs(x="Penetracion internet(%)pobllacion", y="Cantidad de paises",
       title="Penetracion de internet en paises latam")+
  theme(legend.position = 'none')+
  theme(panel.background = element_blank(),panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())
library(dplyr)
economy <- mean(orangeec$GDP.PC)
economy
orangec <-orangeec %>%
  mutate(Strong_economy = ifelse(GDP.PC < economy,
                                 "Por debajo promedio pib per capita",
                                 "Sobre-Arriba promedio pib per capita"))
ggplot(orangec, aes(x=Strong_economy, y=Creat.Ind...GDP,
                    fill=Strong_economy))+
  geom_boxplot(alpha=0.4)+
  labs(c="Tipo de pais", y="Aporte economia naranja al pib",
       title="Aporte economia naranja en pib paises latam con
       alto y bajo pib per capita")+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())

El boxplot indica que los paises sobre el promedio en pib per capita tienen una dispersion mucho mas alta en cuanto a los aportes de la economia naranja al pib del pais. OJO confirmar con desviacion estandar.

Excelente manera de documentar todo lo que hemos jugado con R!

Supremamente útil esta clase.

Interesante, me imagino que tambien se podria colocar partes de codigo html en los comentarios, luego lo intentare. Muy interesante forma de compartir un proyecto.

Buenas tardes
min 5:00
Me sale "El sistema no puede encontrar el archivo especificado"
Le estoy especificando la ruta del archivo orangeec.csv el cual está en mi escritorio (/Escritorio/Orangeec.csv) y ni así me deja proceder.
Ayuda por favor

Pues es mucho más fácil en Python con los Notebooks.

---
title: "Economia Naranja"
author: "Javier Santiago Salgado"
date: "8/1/2021"
output: html_document
---

```{r}
orangeec <- read.csv("orangeec.csv")
data(orangeec)
summary(orangeec)
Parece que hay correlación entre aporte de economía naranja al PIB y el desempleo
```{r} 
pairs(orangeec[, 6:10])
```

```{r}
library(ggplot2)
```
```{r}
ggplot() + geom_histogram(data=orangeec,
                          aes(x=Internet.penetration...population), fill = 'red', color = 'yellow',
                          binwidth = 5)+
  labs(x='Penetración Internet (%) Población',
       y='Cantidad de paises',
       title= 'Penetración de Internet en paises latam')+
  scale_x_continuous(breaks = seq(40,max(100),5))+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())
```
```{r}
library(dplyr)
```
```{r}
economy <- mean(orangeec$GDP.PC)
economy
```
```{r}
orangeec <- orangeec %>%
  mutate(Strong_economy = ifelse(GDP.PC < economy,
                                 "Por debajo promedio PIB per cápita",
                                 "Sobre Arriba promedio PIB per cápita"))

```
```{r}
ggplot(orangeec,aes(x=Strong_economy,y=Creat.Ind...GDP, fill=Strong_economy))+
  geom_boxplot(alpha = 0.4)+
  labs(x='Tipo de país',
       y='Aporte economia naranja al PIB',
       title = 'Aporte economia naranja al PIB paises latam con alto y bajo PIB per capita')+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())


```
El boxplot indica que los paises sobre el promedio en PIB Per Cápita, tienen una dispersion más alta.Se requiere confirmación con desviación estandar.


¡Hola comunidad!, tengo problemas con los acentos, al “knitearlo” simplemente remueve las vocales acentuadas. ¿Alguna idea de por qué esto ocurre?, ¿será por el tipo de extensión UTF-8 en que he guardado el archivo html?, algo importante es que trabajo desde una Mac.