Bienvenida e introducción

1

Todo lo que aprenderás sobre el lenguaje R

2

Programación y Data Science

3

R y proyecto economía naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros cálculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qué es EDA: Exploratory Data Analysis

14

Gráficas de dispersión e histogramas.

15

Box Plot y su interpretación

16

EDA con dataset proyecto - Gráficas de dispersión.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gráficas de dispersión con más de dos variables - ggplot2

22

EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly

La estadística de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la función cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la función cor en dataset proyecto.

27

Protegiéndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los cálculos.

29

Estadística y visualización aplicada a análisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualización

32

Viendo más información con facet wrap - Parte 1

33

Viendo más información con facet wrap - Parte 2

Organizar visualizaciones y código con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.

Conclusiones Finales

35

Invitación a continuar recorriendo el mundo del data science.

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

No se trata de lo que quieres comprar, sino de quién quieres ser. Aprovecha el precio especial.

Antes: $249

Currency
$209

Paga en 4 cuotas sin intereses

Paga en 4 cuotas sin intereses
Suscríbete

Termina en:

14 Días
20 Hrs
12 Min
24 Seg

Factores, listas y echar un vistazo al dataset

12/35
Recursos
  • head: es una función que nos retorna los primeros elementos de un dataset, por defecto nos retorna los primeros 6.
  • tail: función similar a head solamente que esta función nos retorna los últimos elementos.

Además de poder visualizar un dataset con str podemos instalar el paquete dplyr: install.packages(“dplyr”). Una vez instalado usamos la función glimpse.

Una lista es un vector genérico que puede contener objetos de todo tipo, en R para crear una lista solamente debes llamar a la función list y pasarle como argumentos los elementos.

Aportes 48

Preguntas 7

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Igualmente cuando usamos la función head() por defecto devuelve los 6 primeros valores, pero este puede ser configurable añadiendo un parámetro:

head(orangeec, n = 3)

así mostramos los tres primeros valores. Lo mismo sucede con tail()

tail(orangeec, n = 2)

P R E S T A ☝ A T E N C I Ò N 😜
.
.
FACTORES

.
.

LISTAS

.
.

ECHAR UN VISTAZO AL DATASET
.
head()

.
tail()

.
glimpse()

.
str()

Algo muy curioso es que R no trabaja con indices en 0 , si no, que directamente comienza en 1

Dejo también un libro llamado “Analizar Datos Políticos” para ampliar el conocimiento en R. Saludos comunidad! https://arcruz0.github.io/libroadp/index.html

Otra forma de requerir o importar un paquete que acabamos de instalar es require(“dplyr”). Que es parecido a library(“dplyr”)

en:

my_matrix <- matrix(1:9, ncol = 3)

más que indicando (min. 6:40) que la secuencia numerada se ordene por columnas (algo como un ORDER BY en SQL), se está indicando que la tabla se arme con 3 columnas, el que la secuencia se ordene por columnas es el método por defecto de R, no obstante, si a esta misma instrucción le agregamos el parámetro byrow = TRUE ahí estamos cambiando el comportamiento por defecto especificando que la secuencia se ordene por filas, favor confirmar si estoy en lo correcto, saludos!

Resumen


Cuarteto de Anscombe: hace mención a la importancia de visualizar los datos antes de enfocarnos en las fórmulas estadísticas. Lo que es muy importante en Data Science para analizar los datos.

Ref. de Wikipedia

Que son factores

#Factores listas y echar un vistazo al dataset
nivel_curso <- c( "basico", "intermedio", "avanzado")
nivel_curso

#echar un vistazo a la parte superio del dataset, R me muestra los primeros 6 resultados
head(mtcars)
head(orangeec)

#vistazo de que en que termina el dataset
tail(mtcars)
tail(orangeec)

#vistazo general con glipse. Instalar paquete ("dplyr")
glimpse(orangeec)

#crear listas
my_vector <- 1:8
my_vector
my_matrix <- matrix(1:9, ncol=3)
my_matrix
my_df <- mtcars[1:4,]
my_df

#muestra todas los valores de cada una de las listas
my_list <- list(my_vector, my_matrix, my_df)
my_list

La función glimpse también se habilita al escribir.
dplyr::glimpse(orangeec)

Claro, después de haber instalado la paquetería.
Me sirvió verlo aquí en los comentarios.

Buenos dias, primero que todo, los felicito por el curso, muy bueno. Segundo, tengo un proyecto de C# y utilizo MVC, y me gustaría empezar a involucrar R, en unos reportes que me estan solicitando. Tengo una duda, como se puede hacer esta integración, y segundo cual es la mejor practica para realizar una conexión hacia una base de datos la cual es SqlServer?

Gracias

Factores.
un tipo de dato que tiene variables categóricas.

Para las personas que quieren colocar algo de análisis o comentarios dentro de sus códigos, hay dos opciones. 1. Usando scripts (.R) usar # antes de cada comentario, de esa forma esa línea no se ejecuta. Así mismo cuando ejecutamos varias líneas podemos prevenir o controlar las líneas ejecutadas. 2. Usando Notebooks, los Notebooks son documentos que permiten incrustar líneas de código, así podemos ir escribiendo preguntas, código relacionado y resultados. Para crear un Notebook nos vamos a File-New-Rnotebook

Excelente clase, hay cosas que cambian de lenguajes anteriores

Excelente profesora!

### **Factores** Los **factores** en R se utilizan para representar datos categóricos, lo cual es útil cuando tienes datos que pertenecen a grupos específicos, como géneros, colores o categorías de productos. Los factores no solo almacenan valores, sino también los niveles posibles de la categoría, lo que puede ser útil para análisis estadísticos y visualización. ### **Listas** Las **listas** en R permiten almacenar distintos tipos de datos en una sola estructura, lo cual es muy útil para trabajar con datos de distintas clases. A diferencia de un `vector`, que solo almacena un tipo de dato, una lista puede incluir números, texto, vectores, `data.frames`, entre otros.

De manera más sencilla:

mi_lista = list(1, "dos", FALSE, 5.5)

Entiendo que factor son datos categóricos, pero lo que creamos fue un vector de caracteres.

Creo que faltó lo siguiente:
Nivel_Curso = as.factor(Nivel_Curso)

O estoy equivocado?

recuerden que si las librerias no funcionan es porque deben llamarlas con library(nombre de la libreria que han instalado)

En “my_matrix” por defecto: byrow = FALSE
Por eso los numeros se agrupan por columnas, no tiene que ver el “ncol”

la señora empieza a trabajar y no explica ni lo que va a hacer…

Sino les funciona glimpse, instalen también la librería tibble y les funciona.

No se a quién le pueda servir, pero si tienen mac, toca instalar Pillar adicional a dbplyr, de esta forma nos funciona glimpse. Mejor descargarlo e instalarlo desde CRAN.

Hola porque en el elemento de my_matrix <- matrix (1:9, ncol= 3) este numero 3 tiene que ser ese y no puede ser ni 4 ni 2 ???

head(dataset) #6
tail(dataset) #6

#description
str(dataset)

instal.package(“dplyr”)

#otra forma de description
glipse(dataset)

vector1 <- 1:8 #1 al 8
matriz1 <- matrix(1:9, ncol=3) #3 columnas 1 al 9

,1  ,2  ,3

1, 1 4 7
2, 2 5 8
3, 3 6 9

#primeros 4 registros
my_df <- mtcars=[1:4,]

#unit todo en lista
list1 <- list(vector1, matriz1, my_df)

Si todo lo podemos meter en una lista… ¿podemos meter listas dentro de las listas?

Nivel_curso <- c('Basico', 'Intermedio', 'Avanzado')
Nivel_curso

head(mtcars)
head(orangeec)

tail(mtcars)
tail(orangeec)

glimpse(orangeec)

my_vector <- 1:8
my_matrix <- matrix(1:9, ncol = 3)
my_df <- mtcars[1:4,]

my_vector
my_matrix
my_df

my_list <- list(my_vector, my_matrix, my_df)
my_list```

Por si alguien se traba con el glimpse, pongan esto:

library(dplyr) glimpse(mtcars)

Muy buen curso, estoy aprendiendo mucho de R.

Para acceder a un objeto de una lista se usan indices. En este caso al vector se accede con my_list[1]. Para la matrix con my_list[2]. Para el data frame con my_list[3]. Esto difiere de python en donde los indices inician en cero.

Fcatores

Hola Sonia! Instalé correctamente ´dplyr´, pero al correr la función glimpse , me sale este error:

glimpse(orangeec)
Error in glimpse(orangeec) : could not find function “glimpse”

Crees que sea por la versión de R Studio? me ayudas por favor? gracias!

![](

¿Por qué dice que la variable Nivel_Curso es un factor, si ejecutando la función typeof(Nivel_Curso) me devuelve que es de tipo ‘character’? ¿Qué diferencia hay y cómo armo correctamente un factor?

Excelente clase, a seguir practicando


Nivel_curso <- c('Basico','Intermedio','Avanzado')
Nivel_curso

head(mtcars)
head(orangeec)

tail(mtcars)
tail(orangeec)

glimpse(orangeec)

my_vector <- 1:8
my_matrix <- matrix(1:9, ncol=3)
my_df <- mtcars[1:4,]

my_list <- list(my_vector,my_matrix,my_df)

Hola Sonia
no puedo correr la linea
glimpse(orangeec)
me sale este error
Error in glimpse(orangeec) : could not find function “glimpse”

instale sin problema “dplyr”, porque sera? por favor ayuda

Excelente esta clase! Ayuda a clarar muchos conceptos, particularmente los objetos que se usan en un proyecto.

esa lista la podemos llamar dataframe entonces?

Voy probando en R Studio y en Jupyter.

En caso de que se quiera utilizar nuevamente el código hay que colocar:

library(dplyr)

Hola,

La clase me encantó, adicionalmente me gustaría agregar que también se puede cambiar de nombre a los elementos de una lista. Saludos.

names(lista_1) <- c(‘vector_1’, ‘matrix_1’, ‘data_frame_1’)

Qué tengo que hacer cuando me sale éste error al inentar instalar el paquete “dplyr”?

> install.packages("dyplr")
WARNING: Rtools is required to build R packages but is not currently installed. Please download and install the appropriate version of Rtools before proceeding:

https://cran.rstudio.com/bin/windows/Rtools/
Installing package into ‘C:/Users/Luis/Documents/R/win-library/4.0’
(as ‘lib’ is unspecified)
Warning in install.packages : package ‘dyplr’ is not available for this version of R

A version of this package for your version of R might be available elsewhere, see the ideas at
https://cran.r-project.org/doc/manuals/r-patched/R-admin.html#Installing-packages```

Saben porque cuando aplicamos un factor, les sale NA???