Bienvenida e introducci贸n

1

Todo lo que aprender谩s sobre el lenguaje R

2

Programaci贸n y Data Science

3

R y proyecto econom铆a naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros c谩lculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qu茅 es EDA: Exploratory Data Analysis

14

Gr谩ficas de dispersi贸n e histogramas.

15

Box Plot y su interpretaci贸n

16

EDA con dataset proyecto - Gr谩ficas de dispersi贸n.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gr谩ficas de dispersi贸n con m谩s de dos variables - ggplot2

22

EDA con dataset proyecto usando gr谩ficas de dispersi贸n con m谩s de dos variables - ggplot2 - plotly

La estad铆stica de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la funci贸n cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la funci贸n cor en dataset proyecto.

27

Protegi茅ndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los c谩lculos.

29

Estad铆stica y visualizaci贸n aplicada a an谩lisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualizaci贸n

32

Viendo m谩s informaci贸n con facet wrap - Parte 1

33

Viendo m谩s informaci贸n con facet wrap - Parte 2

Organizar visualizaciones y c贸digo con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del an谩lisis en un documento PDF.

Conclusiones Finales

35

Invitaci贸n a continuar recorriendo el mundo del data science.

No tienes acceso a esta clase

隆Contin煤a aprendiendo! 脷nete y comienza a potenciar tu carrera

Adquiere por un a帽o todos los cursos, escuelas y certificados por un precio especial.

Antes: $249

Currency
$219/a帽o

Paga en 4 cuotas sin intereses

Paga en 4 cuotas sin intereses
Comprar ahora

Termina en:

1D
13H
14M
13S

Factores, listas y echar un vistazo al dataset

12/35
Recursos
  • head: es una funci贸n que nos retorna los primeros elementos de un dataset, por defecto nos retorna los primeros 6.
  • tail: funci贸n similar a head solamente que esta funci贸n nos retorna los 煤ltimos elementos.

Adem谩s de poder visualizar un dataset con str podemos instalar el paquete dplyr: install.packages(鈥渄plyr鈥). Una vez instalado usamos la funci贸n glimpse.

Una lista es un vector gen茅rico que puede contener objetos de todo tipo, en R para crear una lista solamente debes llamar a la funci贸n list y pasarle como argumentos los elementos.

Aportes 47

Preguntas 6

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad?

o inicia sesi贸n.

Igualmente cuando usamos la funci贸n head() por defecto devuelve los 6 primeros valores, pero este puede ser configurable a帽adiendo un par谩metro:

head(orangeec, n = 3)

as铆 mostramos los tres primeros valores. Lo mismo sucede con tail()

tail(orangeec, n = 2)

P R E S T A 鈽 A T E N C I 脪 N 馃槣
.
.
FACTORES

.
.

LISTAS

.
.

ECHAR UN VISTAZO AL DATASET
.
head()

.
tail()

.
glimpse()

.
str()

Algo muy curioso es que R no trabaja con indices en 0 , si no, que directamente comienza en 1

Otra forma de requerir o importar un paquete que acabamos de instalar es require(鈥渄plyr鈥). Que es parecido a library(鈥渄plyr鈥)

Dejo tambi茅n un libro llamado 鈥淎nalizar Datos Pol铆ticos鈥 para ampliar el conocimiento en R. Saludos comunidad! https://arcruz0.github.io/libroadp/index.html

en:

my_matrix <- matrix(1:9, ncol = 3)

m谩s que indicando (min. 6:40) que la secuencia numerada se ordene por columnas (algo como un ORDER BY en SQL), se est谩 indicando que la tabla se arme con 3 columnas, el que la secuencia se ordene por columnas es el m茅todo por defecto de R, no obstante, si a esta misma instrucci贸n le agregamos el par谩metro byrow = TRUE ah铆 estamos cambiando el comportamiento por defecto especificando que la secuencia se ordene por filas, favor confirmar si estoy en lo correcto, saludos!

Resumen


Cuarteto de Anscombe: hace menci贸n a la importancia de visualizar los datos antes de enfocarnos en las f贸rmulas estad铆sticas. Lo que es muy importante en Data Science para analizar los datos.

Ref. de Wikipedia

Que son factores

#Factores listas y echar un vistazo al dataset
nivel_curso <- c( "basico", "intermedio", "avanzado")
nivel_curso

#echar un vistazo a la parte superio del dataset, R me muestra los primeros 6 resultados
head(mtcars)
head(orangeec)

#vistazo de que en que termina el dataset
tail(mtcars)
tail(orangeec)

#vistazo general con glipse. Instalar paquete ("dplyr")
glimpse(orangeec)

#crear listas
my_vector <- 1:8
my_vector
my_matrix <- matrix(1:9, ncol=3)
my_matrix
my_df <- mtcars[1:4,]
my_df

#muestra todas los valores de cada una de las listas
my_list <- list(my_vector, my_matrix, my_df)
my_list

La funci贸n glimpse tambi茅n se habilita al escribir.
dplyr::glimpse(orangeec)

Claro, despu茅s de haber instalado la paqueter铆a.
Me sirvi贸 verlo aqu铆 en los comentarios.

Buenos dias, primero que todo, los felicito por el curso, muy bueno. Segundo, tengo un proyecto de C# y utilizo MVC, y me gustar铆a empezar a involucrar R, en unos reportes que me estan solicitando. Tengo una duda, como se puede hacer esta integraci贸n, y segundo cual es la mejor practica para realizar una conexi贸n hacia una base de datos la cual es SqlServer?

Gracias

Factores.
un tipo de dato que tiene variables categ贸ricas.

Para las personas que quieren colocar algo de an谩lisis o comentarios dentro de sus c贸digos, hay dos opciones. 1. Usando scripts (.R) usar # antes de cada comentario, de esa forma esa l铆nea no se ejecuta. As铆 mismo cuando ejecutamos varias l铆neas podemos prevenir o controlar las l铆neas ejecutadas. 2. Usando Notebooks, los Notebooks son documentos que permiten incrustar l铆neas de c贸digo, as铆 podemos ir escribiendo preguntas, c贸digo relacionado y resultados. Para crear un Notebook nos vamos a File-New-Rnotebook

Excelente clase, hay cosas que cambian de lenguajes anteriores

Excelente profesora!

De manera m谩s sencilla:

mi_lista = list(1, "dos", FALSE, 5.5)

Entiendo que factor son datos categ贸ricos, pero lo que creamos fue un vector de caracteres.

Creo que falt贸 lo siguiente:
Nivel_Curso = as.factor(Nivel_Curso)

O estoy equivocado?

recuerden que si las librerias no funcionan es porque deben llamarlas con library(nombre de la libreria que han instalado)

En 鈥渕y_matrix鈥 por defecto: byrow = FALSE
Por eso los numeros se agrupan por columnas, no tiene que ver el 鈥渘col鈥

la se帽ora empieza a trabajar y no explica ni lo que va a hacer鈥

Sino les funciona glimpse, instalen tambi茅n la librer铆a tibble y les funciona.

No se a qui茅n le pueda servir, pero si tienen mac, toca instalar Pillar adicional a dbplyr, de esta forma nos funciona glimpse. Mejor descargarlo e instalarlo desde CRAN.

Hola porque en el elemento de my_matrix <- matrix (1:9, ncol= 3) este numero 3 tiene que ser ese y no puede ser ni 4 ni 2 ???

head(dataset) #6
tail(dataset) #6

#description
str(dataset)

instal.package(鈥渄plyr鈥)

#otra forma de description
glipse(dataset)

vector1 <- 1:8 #1 al 8
matriz1 <- matrix(1:9, ncol=3) #3 columnas 1 al 9

,1  ,2  ,3

1, 1 4 7
2, 2 5 8
3, 3 6 9

#primeros 4 registros
my_df <- mtcars=[1:4,]

#unit todo en lista
list1 <- list(vector1, matriz1, my_df)

Si todo lo podemos meter en una lista鈥 驴podemos meter listas dentro de las listas?

Nivel_curso <- c('Basico', 'Intermedio', 'Avanzado')
Nivel_curso

head(mtcars)
head(orangeec)

tail(mtcars)
tail(orangeec)

glimpse(orangeec)

my_vector <- 1:8
my_matrix <- matrix(1:9, ncol = 3)
my_df <- mtcars[1:4,]

my_vector
my_matrix
my_df

my_list <- list(my_vector, my_matrix, my_df)
my_list```

Por si alguien se traba con el glimpse, pongan esto:

library(dplyr) glimpse(mtcars)

Muy buen curso, estoy aprendiendo mucho de R.

Para acceder a un objeto de una lista se usan indices. En este caso al vector se accede con my_list[1]. Para la matrix con my_list[2]. Para el data frame con my_list[3]. Esto difiere de python en donde los indices inician en cero.

Fcatores

Hola Sonia! Instal茅 correctamente 麓dplyr麓, pero al correr la funci贸n glimpse , me sale este error:

glimpse(orangeec)
Error in glimpse(orangeec) : could not find function 鈥済limpse鈥

Crees que sea por la versi贸n de R Studio? me ayudas por favor? gracias!

![](

驴Por qu茅 dice que la variable Nivel_Curso es un factor, si ejecutando la funci贸n typeof(Nivel_Curso) me devuelve que es de tipo 鈥榗haracter鈥? 驴Qu茅 diferencia hay y c贸mo armo correctamente un factor?

Excelente clase, a seguir practicando


Nivel_curso <- c('Basico','Intermedio','Avanzado')
Nivel_curso

head(mtcars)
head(orangeec)

tail(mtcars)
tail(orangeec)

glimpse(orangeec)

my_vector <- 1:8
my_matrix <- matrix(1:9, ncol=3)
my_df <- mtcars[1:4,]

my_list <- list(my_vector,my_matrix,my_df)

Hola Sonia
no puedo correr la linea
glimpse(orangeec)
me sale este error
Error in glimpse(orangeec) : could not find function 鈥済limpse鈥

instale sin problema 鈥渄plyr鈥, porque sera? por favor ayuda

Excelente esta clase! Ayuda a clarar muchos conceptos, particularmente los objetos que se usan en un proyecto.

esa lista la podemos llamar dataframe entonces?

Voy probando en R Studio y en Jupyter.

En caso de que se quiera utilizar nuevamente el c贸digo hay que colocar:

library(dplyr)

Hola,

La clase me encant贸, adicionalmente me gustar铆a agregar que tambi茅n se puede cambiar de nombre a los elementos de una lista. Saludos.

names(lista_1) <- c(鈥榲ector_1鈥, 鈥榤atrix_1鈥, 鈥榙ata_frame_1鈥)

Qu茅 tengo que hacer cuando me sale 茅ste error al inentar instalar el paquete 鈥渄plyr鈥?

> install.packages("dyplr")
WARNING: Rtools is required to build R packages but is not currently installed. Please download and install the appropriate version of Rtools before proceeding:

https://cran.rstudio.com/bin/windows/Rtools/
Installing package into 鈥楥:/Users/Luis/Documents/R/win-library/4.0鈥
(as 鈥榣ib鈥 is unspecified)
Warning in install.packages : package 鈥榙yplr鈥 is not available for this version of R

A version of this package for your version of R might be available elsewhere, see the ideas at
https://cran.r-project.org/doc/manuals/r-patched/R-admin.html#Installing-packages```

Saben porque cuando aplicamos un factor, les sale NA???