Bienvenida e introducci贸n

1

Todo lo que aprender谩s sobre el lenguaje R

2

Programaci贸n y Data Science

3

R y proyecto econom铆a naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros c谩lculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qu茅 es EDA: Exploratory Data Analysis

14

Gr谩ficas de dispersi贸n e histogramas.

15

Box Plot y su interpretaci贸n

16

EDA con dataset proyecto - Gr谩ficas de dispersi贸n.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gr谩ficas de dispersi贸n con m谩s de dos variables - ggplot2

22

EDA con dataset proyecto usando gr谩ficas de dispersi贸n con m谩s de dos variables - ggplot2 - plotly

La estad铆stica de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la funci贸n cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la funci贸n cor en dataset proyecto.

27

Protegi茅ndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los c谩lculos.

29

Estad铆stica y visualizaci贸n aplicada a an谩lisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualizaci贸n

32

Viendo m谩s informaci贸n con facet wrap - Parte 1

33

Viendo m谩s informaci贸n con facet wrap - Parte 2

Organizar visualizaciones y c贸digo con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del an谩lisis en un documento PDF.

Conclusiones Finales

35

Invitaci贸n a continuar recorriendo el mundo del data science.

A煤n no tienes acceso a esta clase

Crea una cuenta y contin煤a viendo este curso

Factores, listas y echar un vistazo al dataset

12/35
Recursos
  • head: es una funci贸n que nos retorna los primeros elementos de un dataset, por defecto nos retorna los primeros 6.
  • tail: funci贸n similar a head solamente que esta funci贸n nos retorna los 煤ltimos elementos.

Adem谩s de poder visualizar un dataset con str podemos instalar el paquete dplyr: install.packages(鈥渄plyr鈥). Una vez instalado usamos la funci贸n glimpse.

Una lista es un vector gen茅rico que puede contener objetos de todo tipo, en R para crear una lista solamente debes llamar a la funci贸n list y pasarle como argumentos los elementos.

Aportes 39

Preguntas 5

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesi贸n.

Igualmente cuando usamos la funci贸n head() por defecto devuelve los 6 primeros valores, pero este puede ser configurable a帽adiendo un par谩metro:

head(orangeec, n = 3)

as铆 mostramos los tres primeros valores. Lo mismo sucede con tail()

tail(orangeec, n = 2)

P R E S T A 鈽 A T E N C I 脪 N 馃槣
.
.
FACTORES

.
.

LISTAS

.
.

ECHAR UN VISTAZO AL DATASET
.
head()

.
tail()

.
glimpse()

.
str()

Algo muy curioso es que R no trabaja con indices en 0 , si no, que directamente comienza en 1

Otra forma de requerir o importar un paquete que acabamos de instalar es require(鈥渄plyr鈥). Que es parecido a library(鈥渄plyr鈥)

en:

my_matrix <- matrix(1:9, ncol = 3)

m谩s que indicando (min. 6:40) que la secuencia numerada se ordene por columnas (algo como un ORDER BY en SQL), se est谩 indicando que la tabla se arme con 3 columnas, el que la secuencia se ordene por columnas es el m茅todo por defecto de R, no obstante, si a esta misma instrucci贸n le agregamos el par谩metro byrow = TRUE ah铆 estamos cambiando el comportamiento por defecto especificando que la secuencia se ordene por filas, favor confirmar si estoy en lo correcto, saludos!

Dejo tambi茅n un libro llamado 鈥淎nalizar Datos Pol铆ticos鈥 para ampliar el conocimiento en R. Saludos comunidad! https://arcruz0.github.io/libroadp/index.html

Buenos dias, primero que todo, los felicito por el curso, muy bueno. Segundo, tengo un proyecto de C# y utilizo MVC, y me gustar铆a empezar a involucrar R, en unos reportes que me estan solicitando. Tengo una duda, como se puede hacer esta integraci贸n, y segundo cual es la mejor practica para realizar una conexi贸n hacia una base de datos la cual es SqlServer?

Gracias

Cuarteto de Anscombe: hace menci贸n a la importancia de visualizar los datos antes de enfocarnos en las f贸rmulas estad铆sticas. Lo que es muy importante en Data Science para analizar los datos.

Ref. de Wikipedia

La funci贸n glimpse tambi茅n se habilita al escribir.
dplyr::glimpse(orangeec)

Claro, despu茅s de haber instalado la paqueter铆a.
Me sirvi贸 verlo aqu铆 en los comentarios.

Para las personas que quieren colocar algo de an谩lisis o comentarios dentro de sus c贸digos, hay dos opciones. 1. Usando scripts (.R) usar # antes de cada comentario, de esa forma esa l铆nea no se ejecuta. As铆 mismo cuando ejecutamos varias l铆neas podemos prevenir o controlar las l铆neas ejecutadas. 2. Usando Notebooks, los Notebooks son documentos que permiten incrustar l铆neas de c贸digo, as铆 podemos ir escribiendo preguntas, c贸digo relacionado y resultados. Para crear un Notebook nos vamos a File-New-Rnotebook

Que son factores

Excelente clase, hay cosas que cambian de lenguajes anteriores

Excelente profesora!

head(dataset) #6
tail(dataset) #6

#description
str(dataset)

instal.package(鈥渄plyr鈥)

#otra forma de description
glipse(dataset)

vector1 <- 1:8 #1 al 8
matriz1 <- matrix(1:9, ncol=3) #3 columnas 1 al 9

,1  ,2  ,3

1, 1 4 7
2, 2 5 8
3, 3 6 9

#primeros 4 registros
my_df <- mtcars=[1:4,]

#unit todo en lista
list1 <- list(vector1, matriz1, my_df)

Resumen


Si todo lo podemos meter en una lista鈥 驴podemos meter listas dentro de las listas?

Nivel_curso <- c('Basico', 'Intermedio', 'Avanzado')
Nivel_curso

head(mtcars)
head(orangeec)

tail(mtcars)
tail(orangeec)

glimpse(orangeec)

my_vector <- 1:8
my_matrix <- matrix(1:9, ncol = 3)
my_df <- mtcars[1:4,]

my_vector
my_matrix
my_df

my_list <- list(my_vector, my_matrix, my_df)
my_list```

Hola porque en el elemento de my_matrix <- matrix (1:9, ncol= 3) este numero 3 tiene que ser ese y no puede ser ni 4 ni 2 ???

Por si alguien se traba con el glimpse, pongan esto:

library(dplyr) glimpse(mtcars)

Muy buen curso, estoy aprendiendo mucho de R.

Para acceder a un objeto de una lista se usan indices. En este caso al vector se accede con my_list[1]. Para la matrix con my_list[2]. Para el data frame con my_list[3]. Esto difiere de python en donde los indices inician en cero.

Fcatores

Hola Sonia! Instal茅 correctamente 麓dplyr麓, pero al correr la funci贸n glimpse , me sale este error:

glimpse(orangeec)
Error in glimpse(orangeec) : could not find function 鈥済limpse鈥

Crees que sea por la versi贸n de R Studio? me ayudas por favor? gracias!

![](

驴Por qu茅 dice que la variable Nivel_Curso es un factor, si ejecutando la funci贸n typeof(Nivel_Curso) me devuelve que es de tipo 鈥榗haracter鈥? 驴Qu茅 diferencia hay y c贸mo armo correctamente un factor?

Excelente clase, a seguir practicando


Nivel_curso <- c('Basico','Intermedio','Avanzado')
Nivel_curso

head(mtcars)
head(orangeec)

tail(mtcars)
tail(orangeec)

glimpse(orangeec)

my_vector <- 1:8
my_matrix <- matrix(1:9, ncol=3)
my_df <- mtcars[1:4,]

my_list <- list(my_vector,my_matrix,my_df)

Hola Sonia
no puedo correr la linea
glimpse(orangeec)
me sale este error
Error in glimpse(orangeec) : could not find function 鈥済limpse鈥

instale sin problema 鈥渄plyr鈥, porque sera? por favor ayuda

Excelente esta clase! Ayuda a clarar muchos conceptos, particularmente los objetos que se usan en un proyecto.

esa lista la podemos llamar dataframe entonces?

Voy probando en R Studio y en Jupyter.

En caso de que se quiera utilizar nuevamente el c贸digo hay que colocar:

library(dplyr)

Hola,

La clase me encant贸, adicionalmente me gustar铆a agregar que tambi茅n se puede cambiar de nombre a los elementos de una lista. Saludos.

names(lista_1) <- c(鈥榲ector_1鈥, 鈥榤atrix_1鈥, 鈥榙ata_frame_1鈥)

Qu茅 tengo que hacer cuando me sale 茅ste error al inentar instalar el paquete 鈥渄plyr鈥?

> install.packages("dyplr")
WARNING: Rtools is required to build R packages but is not currently installed. Please download and install the appropriate version of Rtools before proceeding:

https://cran.rstudio.com/bin/windows/Rtools/
Installing package into 鈥楥:/Users/Luis/Documents/R/win-library/4.0鈥
(as 鈥榣ib鈥 is unspecified)
Warning in install.packages : package 鈥榙yplr鈥 is not available for this version of R

A version of this package for your version of R might be available elsewhere, see the ideas at
https://cran.r-project.org/doc/manuals/r-patched/R-admin.html#Installing-packages```
#Factores listas y echar un vistazo al dataset
nivel_curso <- c( "basico", "intermedio", "avanzado")
nivel_curso

#echar un vistazo a la parte superio del dataset, R me muestra los primeros 6 resultados
head(mtcars)
head(orangeec)

#vistazo de que en que termina el dataset
tail(mtcars)
tail(orangeec)

#vistazo general con glipse. Instalar paquete ("dplyr")
glimpse(orangeec)

#crear listas
my_vector <- 1:8
my_vector
my_matrix <- matrix(1:9, ncol=3)
my_matrix
my_df <- mtcars[1:4,]
my_df

#muestra todas los valores de cada una de las listas
my_list <- list(my_vector, my_matrix, my_df)
my_list

Saben porque cuando aplicamos un factor, les sale NA???