Bienvenida e introducción

1

Todo lo que aprenderás sobre el lenguaje R

2

Programación y Data Science

3

R y proyecto economía naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros cálculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qué es EDA: Exploratory Data Analysis

14

Gráficas de dispersión e histogramas.

15

Box Plot y su interpretación

16

EDA con dataset proyecto - Gráficas de dispersión.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gráficas de dispersión con más de dos variables - ggplot2

22

EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly

La estadística de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la función cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la función cor en dataset proyecto.

27

Protegiéndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los cálculos.

29

Estadística y visualización aplicada a análisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualización

32

Viendo más información con facet wrap - Parte 1

33

Viendo más información con facet wrap - Parte 2

Organizar visualizaciones y código con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.

Conclusiones Finales

35

Invitación a continuar recorriendo el mundo del data science.

Crea una cuenta o inicia sesión

¡Continúa aprendiendo sin ningún costo! Únete y comienza a potenciar tu carrera

Instalando nuestras herramientas

4/35
Recursos

Para el curso vamos a necesitar:

Aportes 57

Preguntas 18

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Si les gusta jupyter notebook, se puede instalar el kernel de R para jupyter y trabajar desde allí. Les dejo el link.

https://irkernel.github.io/installation/

Dato de vital importancia para futuras clases:

Al momento de importar el Dataset en RStudio, les aparecerá una ventana de confirmación, en la opción “Heading” colocar YES, verán como selecciona los Row Headers correctos. De lo contrario les aparecerá V1, V2, V3, V4,… como Row Headers y se les hará mas complicado seguir las clases.

Un aporte que hizo también @andresilvagomez en el siguiente video, pero que me fue útil en este:

Cuando le den en import file en la opción de “Heading” tienen que seleccionar YES para especificar que es el nombre de la columna.

Para los que les interes pueden usar R en el Notebook de Google Colab,
Solo deben abrir su carpeta de drive donde va a estar el notebook y ahí pegan este enlace en el navegador de Chrome:
https://colab.research.google.com/notebook#create=true&language=r
Y Listó! 😀👍🏼 Ya siguen las clases en el cuaderno, mucho más limpio, los output los tienen ahí mismo, no deben instalar nada.

gente no se si les ha pasado, pero yo tuve problemas al cargar el dataset de orangeec en RSTUDIO en ubuntu, por algun motivo al cargar me agregaba una fila arriba de todo con los nombres V1 V2 V3 etc.

Esto lo solucione al momento de cargar el dataset eligiendo la opcion “yes” en heading.

Les comento porque yo cargue ese dataset en el curso y muchas cosas que Sonia hacia a mi no me funcionaban (estaba mal importado el dataset)

La clase se llama instalando nuestras herramientas y nunca explicaron como instalarlas, solo se descargaron los archivos. Podrian componer este error en el curso porfavor?

_Instalacion de R y RSTUDIO_en UBUNTU 20.04

1. R

–> sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys E298A3A825C0D65DFD57CBB651716619E084DAB9

–> sudo add-apt-repository ‘deb https://cloud.r-project.org/bin/linux/ubuntu focal-cran40/’

–> sudo apt-get update

–> sudo apt install r-base

Verificando la version de R

–> sudo -i R

2. R Studio

Descargamos de la pagina oficial: https://rstudio.com/products/rstudio/download/
Ejecutamos la consola desde la ubicacion de Download y espcificar la version.

–> sudo apt install ./rstudio-1.3.959-amd64.deb

Una alternativa para trabajar en un notebook y no instalar nada es Deepnote. Un notebook en la nube con la que puede trabajar tanto en python como R

Deepnote

Par Ubuntu 20.04 Focal Fossa

  1. se cercioran de tener instalado gdebi
sudo apt install gdebi
  1. Instalan el paquete básico de R
sudo apt -y install r-base gdebi-core
  1. Descargan directamente desde la pagina:
wget https://download1.rstudio.org/desktop/bionic/amd64/rstudio-1.2.5042-amd64.deb
  1. Luego lo instalan
sudo gdebi rstudio-1.2.5042-amd64.deb
  1. arrancan Rstudio con el comando
rstudio

y listo

Instalación

R : https://cran.r-project.org/

R Sudio: https://www.rstudio.com/products/rstudio/download/

Si les gusta Jupyter Notebook, se puede instalar el kernel de R para jupyter y trabajar desde allí. Les dejo el link. https://irkernel.github.io/installation/

Pueden usar R en el Notebook de Google Colab, solo deben abrir su carpeta de drive donde va a estar el notebook y ahí pegan este enlace en el navegador de Chrome: https://colab.research.google.com/notebook#create=true&language=r

Dataset 👉  dataset de Orange Economy.


IMPORTAR DATASET A R STUDIO

Abrimos R Studio y en la pestaña Enviroment —> Import Dataset —> From Text (base)

determinamos la ruta en nuestro pc donde tenemos el dataset que es un archivo csv

En el proceso de importación indicamos que se activen los encabezados y luego importar


Luego visualizamos nuestro dataset

Ahora para seleccionar el espacio dónde escribiremos el código vamos a

File —> New file —> R Script

En la ventana de consola

  • Para generar un output, ver una información, seleccionamos lo que queremos ver y oprimimos enter
  • Para borrar algo usamos ctrl + L

Si quieren tener el archivo descargado en sus computadores desde R, así como un método de lectura directo, lo primero sería fijar el directorio de trabajo, desde la terminal o con la función

setwd()

Una vez hecho esto, pueden crear una carpeta con la función

dir.create(“carpeta”)

donde “carpeta” es el nombre del directorio. Una vez definido eso, pueden ir al RAW de GitHub y le dan click derecho y copiar enlace, esa parte es muy importante.

Se fija una variable de entorno en R, que llamare “url”, a esa variable le asignamos el link obtenido. Una vez almacenado ya podemos almacenar nuestra base de datos en el directorio fijado con la función

download.file()

y en caso que queramos leer el archivo sin almacenar, podemos de una vez llamarlo por medio de la función

read.csv()

Aquí en la imagen dejo el código.

Realmente no me gustó esta clase porque la profesora no dio el paso a paso de cómo instalar R en Windows, tuve que ver un vídeo que pusieron en los comentarios para poder saber que opciones escoger.

Quienes vayan llegando nuevo al curso les dejo este link para que no se enreden en la instalación
https://www.youtube.com/watch?v=E5KzCLn1EsI

Esta es la descripción de las variables del dataset economía naranja que se encuentra en https://github.com/sap0408/Orange-Economy

  1. Country - País
  2. GDP.PC - Producto interno bruto per capita
  3. GDP.US.bill - Producto interno bruto en billones de dólares
  4. GDP.Growth… - Porcentaje de crecimiento del PIB
  5. Services…GDP - Aporte de servicios a PIB.
  6. Creat.Ind…GDP - Aporte de economía naranja a PIB.
  7. Inflation - Inflación.
  8. Unemployment - Tasa de desempleo.
  9. X…pop.below.poverty.line - Población debajo de la línea de pobreza.
  10. Internet.penetration…population - Penetración de internet.
  11. Median.age - Edad mediana de la población.
  12. X…pop.25.54 - Porcentaje de la población entre 25-54 años.
  13. Education.invest…GDP - Inversión en educación %PIB.

Dejo unos links interesantes acerca de economía naranja en Colombia e interpretación del PIB
https://economipedia.com/definiciones/producto-interior-bruto-pib.html
https://economianaranja.gov.co/abc-economia-naranja/

Es bastante importante limpiar la consola (Ctrl + L), pues tener llena la consola implica la ralentización del sistema. En mi caso me sucedió y después de leer un par de post en internet encontre que ese era el inconveniente.
Saludos!

En este caso tambien se puede incoporar R para visual studio

Les comparto esto, que me pareció genial:

Cheat-sheet del entorno de R. En español

Esta es la clase mas mala que he visto, puros pantallazos que solo confunden.
<https://github.com/sap0408/Orange-Economy/blob/master/orangeec.csv>

Hola,

Acá un tutorial en youtube de cómo instalar R, por si alguien se pierde con la explicación de la profesora y la imágen de arriba.

El video es del canal “ingenieros matemáticos”, no es de mi propiedad. Solo cito fuente.

Saludos

https://www.youtube.com/watch?v=1WXgaa2Spp0

Yo siempre prefiero iniciar desde New project y así ir organizando mis trabajos

Es muy útil que el kernel de jupyter para R esté disponible en Google Colab. Dejo una liga para que puedan inicializar una libreta en el momento que ustedes quieran:

https://colab.research.google.com/notebook#create=true&language=r

para abril del 2022 esta en la versión Download R-4.2.0 for Windows y RStudio Desktop 2022.02.2+485

Para el 22/12/2018 ya esta en la versión 3.5.2 en Windows.

No hay novedades es muy similar a lo que hace la profesora.

Resumen

En esta clase aprendimos a instalar las herramientas para el análisis de datos, así como cargar un dataset que está en CSV(Archivos separados por comas) a RStudio //Enviroment/importDataset/FromText(Base). Para limpiar la consola está el comando ctl+L.

Hola platzi friends, aqui les dejo un link del Banco Interamericano de Desarrollo sobre la economía naranja. Tienen un libro muy interesante.

link del dataset en github de economia naraja que sale en la clase: <https://github.com/sap0408/Orange-Economy/blob/master/orangeec.csv>

Para poner Rstudio en darkmode vayan a tools -> Terminal -> Terminal options -> appearance -> Editor themey ahi hay una lista con previsualizacion para que elijas el que mas te guste.

Se debería ser más específico en cuanto a la instalación de R, Rstudio y la carga de la base de datos

Compañeros adicional a los programas instalen Rtools
https://cran.r-project.org/bin/windows/Rtools/
Esto les facilita la vida con los paquetes que fueron un dolor de cabeza para mi.
Asimismo, si en los ejemplos tienen errores, aun con todo igual, traten cambiando los espacios en el codigo(indentación) eso también llevo descubrirlo mucho tiempo. Con gusto!

CSV = Comma Separated Values
Valores separados por comas. Es un formato para guardar tablas de datos en formato de texto. Simplemente usando una coma como separador de columnas. Es muy popular para exportar datos desde y hacia una hoja de calculo (Excel, LibreOffice, etc)

los parametros de ineters de read.csv es header=TRUE para indicar que la primera fila son los nombres de variables y sep="," para indicar que el archivo csv es por separacion de comas.

Listo! Instalado!

Dataset en repositorio de GitHub: http://github.com/sap0408

Ya quedo instalado

Hola! Les agradezco me pudieran por favor ayudar…Habiendo instalado R y RStudio, al abrir RStudio aparece la pantalla negra y no me permite hacer nada; adjunto imágen. Gracias!!

Descargando dataset

Descargando R Studio: Interfaz

Descargando R: Lenguaje

En este caso yo trabajo con las siguientes versiones
R 3.5.2 for Windows
RStudio-1.1.463.exe

hola chicos… en la descarga de rstudio se muestran Zip/Tarballs, sabran que es?
salu2

Excelentes primeros pasos.

Instalado

buen día a todos

Actualmente soy nuevo en R, pero tengo un problema y me gustria que alguno me ayudara. Resulta que tengo una aplicación en MVC y quiero integrarla con una base de datos que esta en SQL. Me pueden indicar como puedo realizar esta integración?, la conexión hacia la base datos solo se puede realizar medienta un odc?, buscando encontre un paquete que se llama RSQLServer, pero no he podido instalarlo porque me dice la version de R no lo soporta (la version que tengo es 3.5.3), que puedo hacer? me pueden ayudar. Gracias.

Se agradece tener los enlaces a mano.
Sería bueno agreguen las versiones con las que trabajan al momento de subir la clase y añadir última fecha en que se los agregó ya que las versiones pueden cambiar con el paso del tiempo.

Todo listo e instalado

Listo!!!


No sé cual es el problema, eparentemente ya instalé Rstudio pero al momento de querer abrir me aparece esta ventana. Y lo desinstalé y lo volví a instalar varias veces pero siempre es el mismo resultado, Alguien sebe porque?

Alguien ha probado con Visual Studio code?

INSTALÉ LA ÚLTIMA VERSIÓN DE R Y R STUDIO

Ya admiraba mucho el background científico y tecnológico de la profesora antes de saber que usaba Debian.

Ctrl + L sería como el clear en R.

En la fecha que hago el curso vamos en la versión 4.0.4 y hay más archivos en le GitHub. Iré viendo los cambios y ajustes con las actualizaciones.

Buenas tardes profesora, a la fecha ya no esta el archivo orange.csv en su plataforma no se si lo pueda subir nuevamente, gracias