Bienvenida e introducción

1

Todo lo que aprenderás sobre el lenguaje R

2

Programación y Data Science

3

R y proyecto economía naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros cálculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qué es EDA: Exploratory Data Analysis

14

Gráficas de dispersión e histogramas.

15

Box Plot y su interpretación

16

EDA con dataset proyecto - Gráficas de dispersión.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gráficas de dispersión con más de dos variables - ggplot2

22

EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly

La estadística de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la función cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la función cor en dataset proyecto.

27

Protegiéndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los cálculos.

29

Estadística y visualización aplicada a análisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualización

32

Viendo más información con facet wrap - Parte 1

33

Viendo más información con facet wrap - Parte 2

Organizar visualizaciones y código con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.

Conclusiones Finales

35

Invitación a continuar recorriendo el mundo del data science.

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

No se trata de lo que quieres comprar, sino de quién quieres ser. Aprovecha el precio especial.

Antes: $249

Currency
$209

Paga en 4 cuotas sin intereses

Paga en 4 cuotas sin intereses
Suscríbete

Termina en:

13 Días
18 Hrs
40 Min
36 Seg

Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.

34/35
Recursos

Es momento de generar nuestro documento con todas las gráficas y observaciones que hemos realizado a nuestro dataset, para ello necesitamos instalar el paquete rmarkdown: install.packages(“rmarkdown”).

R Markdown nos permite generar archivos en formato HTML, PDF y Word. La mejor opción es trabajar en un formato HTML para compartirlo por internet y posteriormente convertirlo ya sea a PDF o Word.

Dentro de nuestro archivo de R Markdown iremos escribiendo con sintaxis de markdown el archivo y cuando escribamos código por si solo se va a ejecutar y añadir las gráficas o cálculos a nuestro archivo.

Aportes 31

Preguntas 18

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Para introducir un chunk rápidamente podemos usar la combinación de teclas ctrl + alt + i Control, alt y la letra i Es una belleza Saludos

Por acá dejo mi código, yo lo exporté en los tres formatos html, pdf y docx. Es necesario que cambien el simbolo (’) por (`) ya que de otro modo no me lo dejaba subir aquí.

---
title: "Economia Naranja"
author: "Cosme Fulanito"
date: "22-jan-2020"
output: html_document
---

## Generacion de archivos PDF (pdf_document), DOCX(word_document) y HTML (html_document) con R-MARKDOWN
### Comandos para instalar y ejecutar archivo *.rmd
- install.packages("rmarkdown")
- library(rmarkdown)
- install.packages("knitr")
- library(knitr)
- rmarkdown::render('class25.rmd')

̣̣̣'''{r}
orangeec = read.csv(file="orangeec.csv", header=TRUE, sep=",")
̣̣̣'''
̣̣̣'''{r}
summary(orangeec)
̣̣̣'''

### Parece que hay correlacion entre aporte de economia naranja al PIB y la tasa de desempleo.

̣̣̣'''{r}
pairs(orangeec[,6:10])
̣̣̣'''
̣̣̣'''{r}
library(ggplot2)
̣̣̣'''
̣̣̣'''{r}
ggplot()+geom_histogram(data=orangeec,aes(x=orangeec$Internet.penetration...population),
    fill="lightblue",color="darkblue",binwidth=5)+
labs(x="Penetración de Internet (%) población", y="Cantidad de Paises", 
    title="Penetración de Internet en LATAM")+
scale_x_continuous(breaks=seq(38, max(96), 2))+
theme(legend.position="none")+
theme(panel.background=element_blank(), 
    panel.grid.major=element_blank(), panel.grid.minor=element_blank())
̣̣̣'''
̣̣̣'''{r}
library(dplyr)
̣̣̣'''
̣̣̣'''{r}
mean <- mean(orangeec$GDP.PC)
̣̣̣'''
̣̣̣'''{r}
orangeec <- orangeec %>% mutate(strongEconomy = ifelse(GDP.PC < mean, 
    "Por debajo del promedio PIB", "Por encima del promedio PIB"))
̣̣̣'''
̣̣̣'''{r}
ggplot(orangeec, aes(x=strongEconomy, y=Creat.Ind...GDP, fill=strongEconomy))+
geom_boxplot(alpha=0.4)+
labs(x="Tipo de País", y="Aporte Economía Naranja al PIB", 
    title="Aporte Economía Naranja en PIB en LATAM con alto y bajo PIB per cápita")
̣̣̣'''

### El boxplot indica que los paises por encima del promedio del PIB tienen una dispersión mucho mas alta en relación a los aportes de la economía naranja al PIB del país. CUIDADO, contrastar con desviación estándar.

html

pdf

Hay un pequeño error en el minuto 15:51 y es que ese link es una ruta de acceso local y no una URL por lo tanto no sirve para compartir el documento

Hola a todos. Quisiera anotar que, por estética y para facilitar la comunicación de nuestros hallazgos, considero importante ocultar en los chunk la sintaxis del código. Para esto usamos {r, echo=false} y de esta forma se ejecuta nuestro codigo pero la sintaxis nos es visible.
Saludos!!

**Para usuarios de Windows 10 ponen en consola el comando** ``` file.choose() ``` le abre una ventana para buscar el csv lo seleccionan y sale la dirección en la consola lo copian y wala :v

<h3>Publica tu proyecto en Github Pages</h3>
  1. Asegurate que en tu repositorio local renombres el archivo .html como index.html y que la ubicacion del archivo este en la raiz del repositorio. Haz un push para subir tus cambios a Github 👨‍💻
  2. Dirigite a la seccion de Settings dirigete a Github Pages en _select branch _ escogemos master. Le damos a Save 👈

Ya con eso, si regresas Github Pages y en tu repositorio deberias visualizar tu proyecto deployado 😉 …

Por ultimo dejo mi repo por si alguien quiere coloborar, observaciones o notas que podriamos añadir 👀 … Acepto sus Pull Request → Fudamentos de R

También pueden cargar sus datos de la siguiente forma:

file- import dataset- from text(readr).

Buscan el archivo que quieren poner en r y copian el code preview, lo poenen en {r} y listo.

Ejemplo:
library(readr)
orangeec <-read_csv(“C:/Users/L/Desktop/Curso fundamentos R/orangeec.csv”)



Podemos jugar con el tamaño de los títulos añadiendo diferentes cantidades de # al comienzo de cada linea.

Por si alguien más tuvo el mimo problema, aquí comparto mi solución. No me dejaba ejecutar pairs ni el segundo gráfico. summary no se me visualizaba con la información que debería.

orangeec <- read.csv("C:/Users/manut/Google Drive/Platzi/Cursos/Escuelas/Ciencia de Datos/R/Fundamentos/Data/orangeec.csv", encoding="UTF-8", stringsAsFactors=TRUE, sep = ",")

Al leer el archivo me traía un error por no considerar la coma como separador, por lo que tuve que pasarlo como atributo en la función read.csv

Al igual, data(orangeec) tuve que eliminarlo ya que me arrojaba el siguiente error

##Warning message:
In data(orangeec) : data set ‘orangeec’ not found

Este curso me gusto realmente, es la primera vez que utilizo R y RStudio y me han gustado ambas herramientas, espero que Platzi algún día haga más cursos sobre R. Sería genial si algún día crearán una ruta exclusiva sobre programación en R para la Estadística Aplicada. Hace poco ví una Institución en México que enseña matématica y estadística y hay un diplomado que se centra en Estadística y R. Me pareció que si algún día Platzi formará sus rutas como Diplomados sería genial. Una ruta que toque a fondo los siguientes temas: **1. Metodología de la Investigación y principios de programación en R y RStudio** **1.1 Fundamentos de la investigación e instalación de R y Rstudio.** **1.2 Programación en R e importación de bases de datos** **2. Extracción y manipulación de información** **2.1 Manipulación de datos.** **2.2 Exploración y análisis gráfico de datos.** **3. Conceptos de estadística descriptiva e introducción a la estadística inferencial.** **3.1 Estadística descriptiva: conceptos básicos.** **3.2 Estadística inferencial: conceptos básicos.** **4. Análisis de asociación y causalidad.** **4.1 Correlación.** **4.2 Regresión lineal simple y múltiple** **4.3 Modelos lineales generalizados.** **5. Comparando poblaciones** **5.1 Pruebas paramétricas y no paramétricas para comparar dos poblacionales.** **5.2 Pruebas paramétricas y no paramétricas para comparar tres o más poblacionales I.** **5.3 Pruebas paramétricas y no paramétricas para comparar tres o más poblacionales II.** **5.4 Pruebas paramétricas y no paramétricas para comparar tres o más poblacionales III.** **6. Análisis multivariado.** **6.1 Análisis Factorial Exploratorio** **6.2 Análisis de componentes principales** **6.3 Técnicas agrupamiento**
---
title: "Economia Naranja"
author: "Edwin Barrientos"
date: "21/3/2020"
output: html_document
---
```{r}
orangeec <- read.csv("D:/Dropbox/Fundamentos de R/orangeec.csv")
data(orangeec)
summary(orangeec)

Parece que hay correlacion entre aporte de economia naranja al pib y la tasa de desempleo

pairs(orangeec[,6:10])
library(ggplot2)
ggplot()+geom_histogram(data=orangeec,
                        aes(x=Internet.penetration...population),fill='red',color='yellow',
                        binwidth=5)+
  labs(x="Penetracion internet(%)pobllacion", y="Cantidad de paises",
       title="Penetracion de internet en paises latam")+
  theme(legend.position = 'none')+
  theme(panel.background = element_blank(),panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())
library(dplyr)
economy <- mean(orangeec$GDP.PC)
economy
orangec <-orangeec %>%
  mutate(Strong_economy = ifelse(GDP.PC < economy,
                                 "Por debajo promedio pib per capita",
                                 "Sobre-Arriba promedio pib per capita"))
ggplot(orangec, aes(x=Strong_economy, y=Creat.Ind...GDP,
                    fill=Strong_economy))+
  geom_boxplot(alpha=0.4)+
  labs(c="Tipo de pais", y="Aporte economia naranja al pib",
       title="Aporte economia naranja en pib paises latam con
       alto y bajo pib per capita")+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())

El boxplot indica que los paises sobre el promedio en pib per capita tienen una dispersion mucho mas alta en cuanto a los aportes de la economia naranja al pib del pais. OJO confirmar con desviacion estandar.

Pues es mucho más fácil en Python con los Notebooks.

Wow!!!
Que curso mas genial!!!
Ya me imagino un curso avanzado de R!!

MARKDOWN

Me manda error al ejecutar la linea donde lee el csv

<code>
```{r}
orangeec <- read.csv("desktop/R/orangeec.csv")
data(orangeec)
summary(orangeec)

</code>


Error in file(file, "rt") : cannot open the connection
Calls: <Anonymous> ... withVisible -> eval -> eval -> read.csv -> read.table -> file
Execution halted

file:///Users/edrcedano/Downloads/Orange-Economy-master/EconomiaNaranjaRMRKDW.html

R Markdown es una herramienta muy útil para crear documentos reproducibles que combinan texto, código y resultados. Te permite organizar tus hallazgos de análisis de datos y exportarlos en diferentes formatos, como PDF, HTML o Word.
Para Windows El símbolo de la tilde al revés se consigue así: ` = Alt+96

No reproduce el video

Para los que tengan problema al darle “Publish” y le salga que deben actualizar cierto paquetes y le den error, aqui esta la solucion:

Ubuntu 16.04/18.04/20.04
sudo apt-get install libcurl4-openssl-dev r-base

Muy interesante el curso, ayuda mucho al que recien empieza con Data Science

interesante!

No puedo realizar este paso me aparece un error en la lectura del código de ubicación del archivo…alguien por favor me puede ayudar; mi sistema operativo es windows 10

orangeec <- read.csv(Por la ubicacion del archivo no me permite continuar con el proceso)
data(orangeec)
summary(orangeec)

Esta herramienta es super util a la hora de de publicar nuestros documentos

Excelente manera de documentar todo lo que hemos jugado con R!

Supremamente útil esta clase.

Interesante, me imagino que tambien se podria colocar partes de codigo html en los comentarios, luego lo intentare. Muy interesante forma de compartir un proyecto.

Buenas tardes
min 5:00
Me sale "El sistema no puede encontrar el archivo especificado"
Le estoy especificando la ruta del archivo orangeec.csv el cual está en mi escritorio (/Escritorio/Orangeec.csv) y ni así me deja proceder.
Ayuda por favor

---
title: "Economia Naranja"
author: "Javier Santiago Salgado"
date: "8/1/2021"
output: html_document
---

```{r}
orangeec <- read.csv("orangeec.csv")
data(orangeec)
summary(orangeec)
Parece que hay correlación entre aporte de economía naranja al PIB y el desempleo
```{r} 
pairs(orangeec[, 6:10])
```

```{r}
library(ggplot2)
```
```{r}
ggplot() + geom_histogram(data=orangeec,
                          aes(x=Internet.penetration...population), fill = 'red', color = 'yellow',
                          binwidth = 5)+
  labs(x='Penetración Internet (%) Población',
       y='Cantidad de paises',
       title= 'Penetración de Internet en paises latam')+
  scale_x_continuous(breaks = seq(40,max(100),5))+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())
```
```{r}
library(dplyr)
```
```{r}
economy <- mean(orangeec$GDP.PC)
economy
```
```{r}
orangeec <- orangeec %>%
  mutate(Strong_economy = ifelse(GDP.PC < economy,
                                 "Por debajo promedio PIB per cápita",
                                 "Sobre Arriba promedio PIB per cápita"))

```
```{r}
ggplot(orangeec,aes(x=Strong_economy,y=Creat.Ind...GDP, fill=Strong_economy))+
  geom_boxplot(alpha = 0.4)+
  labs(x='Tipo de país',
       y='Aporte economia naranja al PIB',
       title = 'Aporte economia naranja al PIB paises latam con alto y bajo PIB per capita')+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())


```
El boxplot indica que los paises sobre el promedio en PIB Per Cápita, tienen una dispersion más alta.Se requiere confirmación con desviación estandar.


¡Hola comunidad!, tengo problemas con los acentos, al “knitearlo” simplemente remueve las vocales acentuadas. ¿Alguna idea de por qué esto ocurre?, ¿será por el tipo de extensión UTF-8 en que he guardado el archivo html?, algo importante es que trabajo desde una Mac.