Si les gusta jupyter notebook, se puede instalar el kernel de R para jupyter y trabajar desde allí. Les dejo el link.
Bienvenida e introducción
Todo lo que aprenderás sobre el lenguaje R
Programación y Data Science
R y proyecto economía naranja.
Instalando nuestras herramientas
Variables, tipos de datos y estructuras
Los primeros cálculos con R y variables
Tipos de datos
Estructura del dataset del proyecto
Vectores
Matrices
Ejercicios con matrices
Operadores para comparar y ubicar datos
Factores, listas y echar un vistazo al dataset
EDA: Exploratory data analysis
Qué es EDA: Exploratory Data Analysis
Gráficas de dispersión e histogramas.
Box Plot y su interpretación
EDA con dataset proyecto - Gráficas de dispersión.
EDA con histogramas.
EDA con dataset proyecto - histogramas - ggplot2
EDA con box plot- ggplot2
EDA con dataset proyecto - box plot- ggplot2 - dplyr
EDA con gráficas de dispersión con más de dos variables - ggplot2
EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly
La estadística de los datos
Buscando correlaciones con pairs
Confirmando correlaciones con la función cor
Buscando correlaciones con pairs en dataset proyecto
Confirmando correlaciones con la función cor en dataset proyecto.
Protegiéndonos de los peligros del promedio.
Eliminando los NA's para hacer los cálculos.
Estadística y visualización aplicada a análisis de datos de mercadeo.
Ajustando los datos
Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1
Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2
Mejorando la visualización
Viendo más información con facet wrap - Parte 1
Viendo más información con facet wrap - Parte 2
Organizar visualizaciones y código con R Markdown
Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.
Conclusiones Finales
Invitación a continuar recorriendo el mundo del data science.
Crea una cuenta o inicia sesión
¡Continúa aprendiendo sin ningún costo! Únete y comienza a potenciar tu carrera
Sonia Ardila
Aportes 57
Preguntas 18
Si les gusta jupyter notebook, se puede instalar el kernel de R para jupyter y trabajar desde allí. Les dejo el link.
Dato de vital importancia para futuras clases:
Al momento de importar el Dataset en RStudio, les aparecerá una ventana de confirmación, en la opción “Heading” colocar YES, verán como selecciona los Row Headers correctos. De lo contrario les aparecerá V1, V2, V3, V4,… como Row Headers y se les hará mas complicado seguir las clases.
Un aporte que hizo también @andresilvagomez en el siguiente video, pero que me fue útil en este:
Cuando le den en import file en la opción de “Heading” tienen que seleccionar YES para especificar que es el nombre de la columna.
Para los que les interes pueden usar R en el Notebook de Google Colab,
Solo deben abrir su carpeta de drive donde va a estar el notebook y ahí pegan este enlace en el navegador de Chrome:
https://colab.research.google.com/notebook#create=true&language=r
Y Listó! 😀👍🏼 Ya siguen las clases en el cuaderno, mucho más limpio, los output los tienen ahí mismo, no deben instalar nada.
gente no se si les ha pasado, pero yo tuve problemas al cargar el dataset de orangeec en RSTUDIO en ubuntu, por algun motivo al cargar me agregaba una fila arriba de todo con los nombres V1 V2 V3 etc.
Esto lo solucione al momento de cargar el dataset eligiendo la opcion “yes” en heading.
Les comento porque yo cargue ese dataset en el curso y muchas cosas que Sonia hacia a mi no me funcionaban (estaba mal importado el dataset)
La clase se llama instalando nuestras herramientas y nunca explicaron como instalarlas, solo se descargaron los archivos. Podrian componer este error en el curso porfavor?
_Instalacion de R y RSTUDIO_en UBUNTU 20.04
1. R
–> sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys E298A3A825C0D65DFD57CBB651716619E084DAB9
–> sudo add-apt-repository ‘deb https://cloud.r-project.org/bin/linux/ubuntu focal-cran40/’
–> sudo apt-get update
–> sudo apt install r-base
Verificando la version de R
–> sudo -i R
2. R Studio
Descargamos de la pagina oficial: https://rstudio.com/products/rstudio/download/
Ejecutamos la consola desde la ubicacion de Download y espcificar la version.
–> sudo apt install ./rstudio-1.3.959-amd64.deb
Una alternativa para trabajar en un notebook y no instalar nada es Deepnote. Un notebook en la nube con la que puede trabajar tanto en python como R
Par Ubuntu 20.04 Focal Fossa
sudo apt install gdebi
sudo apt -y install r-base gdebi-core
wget https://download1.rstudio.org/desktop/bionic/amd64/rstudio-1.2.5042-amd64.deb
sudo gdebi rstudio-1.2.5042-amd64.deb
rstudio
y listo
R : https://cran.r-project.org/
R Sudio: https://www.rstudio.com/products/rstudio/download/
Si les gusta Jupyter Notebook, se puede instalar el kernel de R para jupyter y trabajar desde allí. Les dejo el link. https://irkernel.github.io/installation/
Pueden usar R en el Notebook de Google Colab, solo deben abrir su carpeta de drive donde va a estar el notebook y ahí pegan este enlace en el navegador de Chrome: https://colab.research.google.com/notebook#create=true&language=r
Dataset 👉 dataset de Orange Economy.
Abrimos R Studio y en la pestaña Enviroment —> Import Dataset —> From Text (base)
determinamos la ruta en nuestro pc donde tenemos el dataset que es un archivo csv
En el proceso de importación indicamos que se activen los encabezados y luego importar
Luego visualizamos nuestro dataset
Ahora para seleccionar el espacio dónde escribiremos el código vamos a
File —> New file —> R Script
En la ventana de consola
Si quieren tener el archivo descargado en sus computadores desde R, así como un método de lectura directo, lo primero sería fijar el directorio de trabajo, desde la terminal o con la función
setwd()
Una vez hecho esto, pueden crear una carpeta con la función
dir.create(“carpeta”)
donde “carpeta” es el nombre del directorio. Una vez definido eso, pueden ir al RAW de GitHub y le dan click derecho y copiar enlace, esa parte es muy importante.
Se fija una variable de entorno en R, que llamare “url”, a esa variable le asignamos el link obtenido. Una vez almacenado ya podemos almacenar nuestra base de datos en el directorio fijado con la función
download.file()
y en caso que queramos leer el archivo sin almacenar, podemos de una vez llamarlo por medio de la función
read.csv()
Aquí en la imagen dejo el código.
Realmente no me gustó esta clase porque la profesora no dio el paso a paso de cómo instalar R en Windows, tuve que ver un vídeo que pusieron en los comentarios para poder saber que opciones escoger.
Quienes vayan llegando nuevo al curso les dejo este link para que no se enreden en la instalación
https://www.youtube.com/watch?v=E5KzCLn1EsI
Esta es la descripción de las variables del dataset economía naranja que se encuentra en https://github.com/sap0408/Orange-Economy
Dejo unos links interesantes acerca de economía naranja en Colombia e interpretación del PIB
https://economipedia.com/definiciones/producto-interior-bruto-pib.html
https://economianaranja.gov.co/abc-economia-naranja/
Es bastante importante limpiar la consola (Ctrl + L), pues tener llena la consola implica la ralentización del sistema. En mi caso me sucedió y después de leer un par de post en internet encontre que ese era el inconveniente.
Saludos!
En este caso tambien se puede incoporar R para visual studio
Les comparto esto, que me pareció genial:
Descargar R
https://cran.r-project.org/bin/windows/base/
Descargar R Studio
https://www.rstudio.com/products/rstudio/download/#download
Descargar DATASET economía Naranja
https://github.com/sap0408/Orange-Economy
Hola,
Acá un tutorial en youtube de cómo instalar R, por si alguien se pierde con la explicación de la profesora y la imágen de arriba.
El video es del canal “ingenieros matemáticos”, no es de mi propiedad. Solo cito fuente.
Saludos
Yo siempre prefiero iniciar desde New project y así ir organizando mis trabajos
Es muy útil que el kernel de jupyter para R esté disponible en Google Colab. Dejo una liga para que puedan inicializar una libreta en el momento que ustedes quieran:
https://colab.research.google.com/notebook#create=true&language=r
para abril del 2022 esta en la versión Download R-4.2.0 for Windows y RStudio Desktop 2022.02.2+485
Para el 22/12/2018 ya esta en la versión 3.5.2 en Windows.
No hay novedades es muy similar a lo que hace la profesora.
Resumen
En esta clase aprendimos a instalar las herramientas para el análisis de datos, así como cargar un dataset que está en CSV(Archivos separados por comas) a RStudio //Enviroment/importDataset/FromText(Base). Para limpiar la consola está el comando ctl+L.
Para poner Rstudio en darkmode vayan a tools -> Terminal -> Terminal options -> appearance -> Editor themey ahi hay una lista con previsualizacion para que elijas el que mas te guste.
Se debería ser más específico en cuanto a la instalación de R, Rstudio y la carga de la base de datos
Compañeros adicional a los programas instalen Rtools
https://cran.r-project.org/bin/windows/Rtools/
Esto les facilita la vida con los paquetes que fueron un dolor de cabeza para mi.
Asimismo, si en los ejemplos tienen errores, aun con todo igual, traten cambiando los espacios en el codigo(indentación) eso también llevo descubrirlo mucho tiempo. Con gusto!
CSV = Comma Separated Values
Valores separados por comas. Es un formato para guardar tablas de datos en formato de texto. Simplemente usando una coma como separador de columnas. Es muy popular para exportar datos desde y hacia una hoja de calculo (Excel, LibreOffice, etc)
los parametros de ineters de read.csv es header=TRUE para indicar que la primera fila son los nombres de variables y sep="," para indicar que el archivo csv es por separacion de comas.
Listo! Instalado!
Dataset en repositorio de GitHub: http://github.com/sap0408
Ya quedo instalado
Hola! Les agradezco me pudieran por favor ayudar…Habiendo instalado R y RStudio, al abrir RStudio aparece la pantalla negra y no me permite hacer nada; adjunto imágen. Gracias!!
Descargando dataset
Descargando R Studio: Interfaz
Descargando R: Lenguaje
En este caso yo trabajo con las siguientes versiones
R 3.5.2 for Windows
RStudio-1.1.463.exe
hola chicos… en la descarga de rstudio se muestran Zip/Tarballs, sabran que es?
salu2
Excelentes primeros pasos.
Instalado
buen día a todos
Actualmente soy nuevo en R, pero tengo un problema y me gustria que alguno me ayudara. Resulta que tengo una aplicación en MVC y quiero integrarla con una base de datos que esta en SQL. Me pueden indicar como puedo realizar esta integración?, la conexión hacia la base datos solo se puede realizar medienta un odc?, buscando encontre un paquete que se llama RSQLServer, pero no he podido instalarlo porque me dice la version de R no lo soporta (la version que tengo es 3.5.3), que puedo hacer? me pueden ayudar. Gracias.
Se agradece tener los enlaces a mano.
Sería bueno agreguen las versiones con las que trabajan al momento de subir la clase y añadir última fecha en que se los agregó ya que las versiones pueden cambiar con el paso del tiempo.
Todo listo e instalado
Listo!!!
No sé cual es el problema, eparentemente ya instalé Rstudio pero al momento de querer abrir me aparece esta ventana. Y lo desinstalé y lo volví a instalar varias veces pero siempre es el mismo resultado, Alguien sebe porque?
Alguien ha probado con Visual Studio code?
INSTALÉ LA ÚLTIMA VERSIÓN DE R Y R STUDIO
Ya admiraba mucho el background científico y tecnológico de la profesora antes de saber que usaba Debian.
Ctrl + L sería como el clear en R.
En la fecha que hago el curso vamos en la versión 4.0.4 y hay más archivos en le GitHub. Iré viendo los cambios y ajustes con las actualizaciones.
Buenas tardes profesora, a la fecha ya no esta el archivo orange.csv en su plataforma no se si lo pueda subir nuevamente, gracias
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?