Clase 21 🙋
EDA con gráficas de dispersión con más de dos variables - ggplot2
.
.
Ya hemos hecho scatter plot o grafica de dispersion en la Clase 16. Se hizo con plot():
.
plot(mtcars$mpg ~ mtcars$cyl,
xlab=“cilindros”, ylab = “millas por galon”,
main=“Relacion cilindros y millas por galon”)
.
.
Pero en esta clase es con ggplot:
.
ggplot(mtcars, aes(cyl,mpg))+
geom_point()+
labs(x=“cilindros”, y=“millas por galon”,
title=“Relacion cilindros y millas por galon”)+
theme(legend.position = “none”)+
theme(panel.background = element_blank(),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank())
.
.
En ambos ejemplos se ve la “Relacion cilindros y millas por galon” usando dos variables cilindros -cyl- y millas por galon -mpg- ahora vamos a ver como hacer una grafica de dispersion con cuatro variables
.
.
RELACIONANDO CUATRO VARIABLES EN LA MISMA GRAFICA DE DISPERSION O SCATTER PLOT
.
Las cuatro variables son:
.
-hp- caballos de fuerza 🐴
.
-qsec- tiempo en 1/4 de milla
.
-am- tipo de caja 🚗
.
-cyl- cilindros
.
ggplot(mtcars, aes(hp,qsec))+
geom_point(aes(color=am, size=cyl))+
labs(x=“Caballos de fuerza”, y=“Tiempo en 1/4 de milla”,
Title=“Caballos-velocidad segun cilindraje y tipo de caja”)
.
.
.
Lo que se observa en el grafico es la relacion “Caballos-velocidad segun cilindraje y tipo de caja”:
.
En el eje x se encuentra caballos de fuerza -hp-
.
En el eje y esta el tiempo en 1/4 de milla -qsec-
.
El color de las esferas depende del tipo de caja -am-
.
El tamaño de las esferas depende de los cilindros -cyl- del carro
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?