Bienvenida e introducción

1

Todo lo que aprenderás sobre el lenguaje R

2

Programación y Data Science

3

R y proyecto economía naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros cálculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qué es EDA: Exploratory Data Analysis

14

Gráficas de dispersión e histogramas.

15

Box Plot y su interpretación

16

EDA con dataset proyecto - Gráficas de dispersión.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gráficas de dispersión con más de dos variables - ggplot2

22

EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly

La estadística de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la función cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la función cor en dataset proyecto.

27

Protegiéndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los cálculos.

29

Estadística y visualización aplicada a análisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualización

32

Viendo más información con facet wrap - Parte 1

33

Viendo más información con facet wrap - Parte 2

Organizar visualizaciones y código con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.

Conclusiones Finales

35

Invitación a continuar recorriendo el mundo del data science.

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

EDA con gráficas de dispersión con más de dos variables - ggplot2

21/35
Recursos

Aportes 27

Preguntas 5

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Clase 21 🙋
EDA con gráficas de dispersión con más de dos variables - ggplot2

.
.
Ya hemos hecho scatter plot o grafica de dispersion en la Clase 16. Se hizo con plot():
.
plot(mtcars$mpg ~ mtcars$cyl,
xlab=“cilindros”, ylab = “millas por galon”,
main=“Relacion cilindros y millas por galon”)
.

.
Pero en esta clase es con ggplot:
.
ggplot(mtcars, aes(cyl,mpg))+
geom_point()+
labs(x=“cilindros”, y=“millas por galon”,
title=“Relacion cilindros y millas por galon”)+
theme(legend.position = “none”)+
theme(panel.background = element_blank(),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank())
.

.
En ambos ejemplos se ve la “Relacion cilindros y millas por galon” usando dos variables cilindros -cyl- y millas por galon -mpg- ahora vamos a ver como hacer una grafica de dispersion con cuatro variables
.
.
RELACIONANDO CUATRO VARIABLES EN LA MISMA GRAFICA DE DISPERSION O SCATTER PLOT
.
Las cuatro variables son:
.
-hp- caballos de fuerza 🐴
.
-qsec- tiempo en 1/4 de milla
.
-am- tipo de caja 🚗
.
-cyl- cilindros
.
ggplot(mtcars, aes(hp,qsec))+
geom_point(aes(color=am, size=cyl))+
labs(x=“Caballos de fuerza”, y=“Tiempo en 1/4 de milla”,
Title=“Caballos-velocidad segun cilindraje y tipo de caja”)
.

.
.
Lo que se observa en el grafico es la relacion “Caballos-velocidad segun cilindraje y tipo de caja”:
.
En el eje x se encuentra caballos de fuerza -hp-
.
En el eje y esta el tiempo en 1/4 de milla -qsec-
.
El color de las esferas depende del tipo de caja -am-
.
El tamaño de las esferas depende de los cilindros -cyl- del carro

Para aquellos que les moleste el tema blanco de RSTUDIO y deseen cambiarlo
1.- Irse a TOOLS -> GLOBAL OPTIONS -> APPAREANCE
2.- Elegir su EDITOR THEME que deseen.

Tuve problemas con la última gráfica, porque la leyenda de am me salía una escala de colores y no solo dos colores como a la profesora. Revisando los datos vi que en mtcars, los datos de am eran 1 y 0, no estoy seguro si en algún momento de las clases anteriores cambiamos estos datos a Automatic y Manual. (Derrepente me distraje en algun momento 😅)

Así que cambiándolos con mutate pude solucionar mi problema.

mtcars<- mtcars %>%
   mutate(am = ifelse(am == 1, "Automatic", "Manual"))

Espero que esto les sirva.

Respecto a este error: Error: Must request at least one colour from a hue palette.

Solo hay que volver a importar el dataset

## EDA con graficas de dispersion con mas de dos variables - ggplot2

ggplot(mtcars, aes(hp,mpg))+
  geom_point()+
  labs(x="caballos de fuerza", y="millas por galon",
       title="relacion caballos de fuerza y millas por galon")+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())


ggplot(mtcars, aes(wt,hp))+
  geom_point()+
  labs(x="peso", y="potencia",
       title="relacion peso potencia")+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())


ggplot(mtcars,aes(hp,qsec))+
  geom_point(aes(color=am,size=cyl))+
  labs(x="caballos de fuerza", y="tiempo en 1/4 de milla",
       title="caballos velocidad segun cilindraje y tipo de caja")

Tuve complicacion con la variable am… tuve que replicarla encima de este nuevo ejercicio, tal como lo muestra la siguiente imagen… aunque veo q la grafica no es exacta.

Tengo un inconviniente con la instruccion final, al parecer es un error en la etiqueta del color, pero no he podido dar con la solucion, espero puedan ayudarme

Error: Must request at least one colour from a hue palette.

Aqui mi codigo:

ggplot(mtcars, aes(hp,qsec))+
  geom_point(aes(color=am, size=cyl))+
  labs(x="horse power" , y = "tiempo en 1/4 de milla", title = "R HP vs qsec")

habra alguna forma de hacer tooltips, o es que los plots son estaticos? , lo digo porque las bolitas no se distinguen los tamaños a simple vista.

Aqui es posible usar opciones de color, tamaño y forma para personalizar las figuras con las opciones generales de figuras de R Ejem: geom_point(size=3, color=“dodgerblue”, shape=18).

<ggplot(mtcars, aes(wt, hp))+
  geom_point(size=3, color="dodgerblue", shape=18)+
  labs(x="Weight", y="Power",
       title="Relationship power and weight")+
  theme(legend.position="none")+
  theme(panel.background = element_blank(),panel.grid.major=element_blank(),
        panel.grid.minor = element_blank())>

Excelente clase Sonia

¿Qué diferencia el atributo aes al ponerlo dentro de la función ggplot, a ponerlo en la geometría?

ese geom\_point() es una función muy importante, es magnífico que puedas modificar el tamaño y color según determinada variable del dataset. Alucino.

Me Gusta como puedo ultilizar R tan facil y pedirle lo que quiera 🥂🥳.

# Cambiando los valores de am (Automático y Manual)
mtcars<- mtcars %>%
  mutate(am = ifelse(am == 1, "Automático", "Manual"))

#Scatter plot con ggplot con 4 variables
ggplot(mtcars,aes(hp,qsec))+
geom_point(aes(color=am, size=cyl))+
  labs(s='caballos de fuerza', y='tiempo de 1/4 milla',
       title='caballo-velocidad según cilindraje y tipo de caja')

Intenté pegar mi reto, pero aparece en la parte de la imagen, aparece esto

a mi me aparece el siguiente error

Error: Must request at least one colour from a hue palette.

Por favor su ayuda para resolver el error:

ggplot(mtcars, aes(hp,qsec))+

  • geom_point(aes(color=am, size=cyl))+
  • labs(x=“caballos de fuerza”, y=“tiempo en 1/4 milla”,
  •    title="caballos y velocidad según cilindraje y tipo de caja")
    

Error: Must request at least one colour from a hue palette.

Por acá dejo mi ejercicio.
Código

Gráfica

Tengo este error, a alguien le sucede lo mismo?

Error in ggplot(mtcars, aes(hp, mpg)) + geom_point() + labs(x <- "Caballos de fuerza",  : 
  could not find function "+<-"
> #Scatter Plot con ggplot en mtcars
> ggplot(mtcars, aes(hp, mpg))+
+   geom_point()+
+   labs(x="Caballos de fuerza", y="Millas por Galon")+
+   title= "Relacion Caballos y MPG"
Error in ggplot(mtcars, aes(hp, mpg)) + geom_point() + labs(x = "Caballos de fuerza",  : 
  could not find function "+<-"```

Muy buena explicación!

¿Qué está mal?

Error in ggplot(mtcars, aes(hp, qsec)) :
no se pudo encontrar la función “ggplot”

### scater plot con ggplot en mtcars dos variables
  ggplot(mtcars, aes(hp,mpg))+
    geom_point()+
    labs(x="caballos fuerza", y="millas por galon",
         title="Relación caballos de fuerza y millas ppr galon")+
    theme(legend.position = "none")+
    theme(panel.background = element_blank(),panel.grid.major=element_blank(),
          panel.grid.minor=element_blank())
  
  #
  ggplot(mtcars, aes(wt,hp))+
    geom_point()+
    labs(x="peso", y="potencia",
         title="Relación peso-potencia")+
    theme(legend.position = "none")+
    theme(panel.background = element_blank(),panel.grid.major=element_blank(),
          panel.grid.minor=element_blank())
  
  #graficas de puntos con 4 variables
  ggplot(mtcars, aes(hp,qsec))+
    geom_point(aes(color=am,size=cyl))+ # se incluyen las varaibles am como color y tamaño de las burbujas a cyl
    labs(x="caballos de fuerza", y="tiempo en 1/4 millas",
         title ="caballos-velocidad según silindraje y tipo de cajas")
#Relacion de 4 variables en el scatter plot
ggplot(mtcars, aes(hp, qsec))+
  geom_point(aes(color=am, size=cyl))+
  labs(s="Caballos de fuerza", y="1/4 milla por segundo",
       title="Caballos velocidad segun cilindraje y tipo de caja")
   
library(ggplot2)

ggplot(mtcars, aes(hp,mpg))+
  geom_point()+
  labs(x= "Caballos de fuerza",
       y =" millas por galón",
       title = 'Caballos de fuerza y millas por galón ')+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())


ggplot(mtcars, aes(wt,hp))+
  geom_point()+
  labs(x= "Peso",
       y ="Caballos de fuerza",
       title = "Relacion de Peso con Potencia ")+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())

mtcars$am <- factor(mtcars$am, levels = c(1, 0),
                    labels = c('Manual', 'Automatico'))

ggplot(mtcars, aes(hp,qsec))+
  geom_point(aes(color=am, size = cyl))+
  labs(x="Caballos de fuerza",
       y = "Tiempo en recorrer un cuarto de milla",
       title = "Relacion entre caballos de fuerza y tipo de caja")