Bienvenida e introducción

1

Todo lo que aprenderás sobre el lenguaje R

2

Programación y Data Science

3

R y proyecto economía naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros cálculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qué es EDA: Exploratory Data Analysis

14

Gráficas de dispersión e histogramas.

15

Box Plot y su interpretación

16

EDA con dataset proyecto - Gráficas de dispersión.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gráficas de dispersión con más de dos variables - ggplot2

22

EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly

La estadística de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la función cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la función cor en dataset proyecto.

27

Protegiéndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los cálculos.

29

Estadística y visualización aplicada a análisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualización

32

Viendo más información con facet wrap - Parte 1

33

Viendo más información con facet wrap - Parte 2

Organizar visualizaciones y código con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.

Conclusiones Finales

35

Invitación a continuar recorriendo el mundo del data science.

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

EDA con box plot- ggplot2

19/35
Recursos

Para realizar EDA con un box plot dentro de R debemos utilizar la función boxplot, los argumentos que debemos pasarle son:

  • la información que vamos a explorar.
  • ylab: título para el eje y.
  • main: título de la gráfica.

También podemos usar ggplot2 para crear un Box Plot.

Aportes 60

Preguntas 15

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

  • Q1 (25% de los datos)

  • Q2 o mediana (el 50% de los datos)

  • Q3 (75% de los datos)

  • Rango intercuartílico RIC (Q3–Q1)

  • Se consideran atípicos(outliers) los valores inferiores a Q1-1.5·**RIC **o superiores a Q3+1.5·RIC

  • Se pueden considerar valores extremadamente atípicos aquellos que exceden Q1- 3·**RIC **o Q3+3·RIC.

C L A S E 1 9 🤯
EDA con box plot- ggplot2

.
.
El dataset usado fue mtcars 🚗
Se aprende en tres ejemplos como graficar boxplot y hacer un par de modificaciones:
.
as.factor() para indicar que el numero es una categoria. Se paso de ver con error la grafica a ver las tres categorias de 4, 6 y 8 cilindros en cada boxplot correspondiente
.
(alpha= ) para cambiar el color de un boxplot en la grafica. Se cambio un azul oscuro por
un gris para ver la linea de la media
.
dataset$variable <- para cambiar la expresiòn de los datos de una variable. Se paso de TRUE,FALSE a MANUAL, AUTOMATICO
.
.
EJEMPLO 1
"Caballos de fuerza en carros mtcars"
.
ylab = etiqueta en el eje y
main = titulo del boxplot
.

.
.
EJEMPLO 2
"Caballos de fuerza segun cilindros en mtcars"
.
Hay dos ajustes x=as.factor(cyl) y alpha=0.6
.
as.factor para convertir en etiquetas los datos del eje x porque recuerda que en el boxplot se cruza una variable numerica y una categorica
.
alpha=0.6 para modificar el color del boxplot en la categoria de carros con 4 cilindros
.

.
.
EJEMPLO 3
"Millas por galon segun tipo de caja"
.
Se hizo un cambio en la expresiòn de la variable am de TRUE, FALSE a MANUAL, AUTOMATICO:
.
mtcars$am <- factor(mtcars$am, levels=c(TRUE,FALSE),
labels=c(“Manual”, “Automatico”))

.

Cordial Saludo, en mi caso particular cuando me sale el siguiente error:

Error: Must request at least one colour from a hue palette.

Fue debido a que en el reemplazo de TRUE/FALSE por Manual/Automatico quedo con valores NA. Hice la consulta de lo que habia en ese campo con la instruccion mtcars$am y arrojo lo siguiente:

> mtcars$am
 [1] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
[16] <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA> <NA>
[31] <NA> <NA>

Para solucionar esto lo que hice fue cargar nuevamente el dataframe() y realizar nuevamente el reemplazo y funciono correctamente. Adjunto mi codigo

En caso de que tengas el siguiente error:

Error: Must request at least one colour from a hue palette.

asegúrate que la transformación de los labels cambien el contenedor de c(TRUE, FALSE) por c(1, 0) ya que el dataset de mtcars en el campo am está con 1 y 0, el comando a ejecutar es:

mtcars$am <- factor(mtcars$am, levels = c(1, 0),
                    labels = c('Manual', 'Automatico'))

A la dimensión de la caja en el sentido vertical, se le conoce como** rango intercuartílico**, (y son los datos que se encuentran entre el tercer y el primer cuartil), esta es una medida de dispersión de los datos.

Recordemos que el 25% de los datos están dentro del primer cuartil, el 50% de los datos dentro del** segundo cuartil** (mediana), el 75% dentro del tercer cuartil, y al 100% de los datos se le conoce como cuarto cuartil.

Entonces el rango intercuartílico comprende el 50% de los datos (75% - 25%)

En el caso de las gráficas Boxplot (o gráficas de bigote), se hace referencia a la mediana (segundo cuartil) y no a la media, ya que esta no está representada en la gráfica, claro se puede agregar.

Por alguna razón que desconozco, no tenia cambiado mis valores booleano a true or false así que los cambie en el procedimiento que se le asigno a la variable mtcars$am y me funcionó

#
ggplot(mtcars,aes(x=am, y=mpg, fill=am))+
   geom_boxplot()+
   labs(x="tipo de caja",y="millas por galon",
        title="Millas por galon segun tipo de caja-mtcars")+
   theme(legend.position = "none")+
   theme(panel.background = element_blank(),
         panel.grid.major = element_blank(),
         panel.grid.minor = element_blank())


#
mtcars$am <- factor(mtcars$am, levels = c(1,0),
                    labels = c("manual","automatico"))

Si les sale el error:

Error: Must request at least one colour froma hue palette

Significa que cagaron la base de datos, es más, mirenla. Vayan al campo “AM” y vean que dirá “NA”, es decir, nulo/vacío. Importen de nuevo la base mtcars y vuelvan a ejecutar todo pero esta vez corran antes la parte donde se transforman los labels que el ggplot.

Tuve demasiado demasiado problema para poder sacar ese boxplot. En parte fue porque primero busqué la respuesta en los dos libros que han recomendado compañeros anteriormente (R para ciencia de datos y R para principiantes), luego intenté ChatGPT y tampoco daba con el chiste. Ya cuando me estaba frustrando me acordé de que en los comentarios usualmente publican errores que han tenido compañeros anteriormente y la solución que le dieron, así lo logré. No solo me llevó a pensar que ya es hora de que actualicen el curso, sino que es muy valiosa la comunidad de Platzi 😄

Los bigotes del gráfico no son mínimo y máximo, por eso el valor extremo que sale arriba es por arriba del bigote. Si así fuera no existiese un valor que sobre salga de los bigotes

Para el error de

<Error: Must request at least one colour from a hue palette>

Únicamente deben modificar el fill de la siguiente manera

< fill="red">

Estructura final

<ggplot(mtcars, aes(x=am , y=mpg, fill="red"))+
  geom_boxplot()+
  labs(x="Tipo de caja ", y="Millas de galon", title = "Millos por galon")>

Por favor su ayuda para resolver el error:

ggplot(mtcars, aes(x=am, y=mpg, fill=am))+

  • geom_boxplot()+
  • labs(x=“Tipo de caja”, y=“Millas por galón”,
  •    title = "Millas por galón según tipo de caja - mtcars")+
    
  • theme(legend.position = “none”)+
  • theme(panel.background = element_blank(),
  •     panel.grid.major = element_blank(),
    
  •     panel.grid.minor = element_blank())
    

Error: Must request at least one colour from a hue palette.

Reto cumplido
![](

Codigo:

#
ggplot(mtcars, aes(x=am, y=mpg, fill=am))+
  geom_boxplot()+
  labs(x="Tipos de caja", y="millas por galón",
       title = "Millas por galón según tipos de caja mtcars")+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())

# Para ajustar las etiquetas de nuestro boxplot. Sin esto. las
# etiquetas de los dos boxplot se llamaría FALSE y TRUE 
# en vez de Manual y Automático
mtcars$am <- factor(mtcars$am, levels=c(TRUE,FALSE),
                    labels = c("Manual", "Automático")
                    )

chicos, es lavels o labels?

Si alguien viene de usar matplotlib de python, probablemente se le haga mas comodo utilizar la funcion sin libreria que ya viene por defecto en R, creo que es mas sencillo de recordar y de implementar, saludos. ![](https://static.platzi.com/media/user_upload/image-0d168ea7-8b99-4f7f-b6f5-a8bb2e214b07.jpg)![](https://static.platzi.com/media/user_upload/image-a704c9a2-f3bb-4a83-8250-cefe84fe3859.jpg)

El 305 es un valor atipico.
305> Q3+1.5·RIC

Les comparto algo del codigo que utilice para esta clase

#boxplot

boxplot(mtcars$hp,
ylab=“caballos de fuerza”,
main=“Caballos de fuerza en carros mtcars”)

#usamos el package ggplot para tener un mejor grafico
#boxplot por separado
ggplot(mtcars, aes(x=as.factor(cyl),y=hp,fill=cyl))+
geom_boxplot(alpha=0.6)+
labs(x=“cilindros”,
y=“caballos de fuerza”,
title=“Caballos de fuerza segun cilindros en mtcars”)+
theme(legend.position = “none”)+
theme(panel.background = element_blank(),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank())

#usamos el package ggplot para tener un mejor grafico
#boxplot por separado
ggplot(mtcars,aes(x=as.factor(am),y=mpg,fill=am))+
geom_boxplot()+
labs(x=“Tipo de caja”,
y=“millas por galon”,
title=“Millas por galon segun tipo de caja mtcars”)+
theme(legend.position = “none”)+
theme(panel.background = element_blank(),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank())

#cambiar variables del grafico en el dataset
#ajustando etiquetas en el eje x
mtcars$am <- factor(mtcars$am, levels=c(0,1),
labels=c(“Manual”,“Automatico”))

Comparto visualización de gráfica Boxplot del dataset mtcars:

Solución para “Error: Must request at least one colour from a hue palette.”

  • Primero recuerden que el data set original viene con la variable AM con valor de 0 Y 1
  • En clases anteriores la profesora pasó esos valores de 0 y 1 a valores booleanos es decir “TRUE or FALSE”.
    Para hacer ello ella usó:
  • Nosotros lo más probable es que hayamos cerrado la ventana y hubiéramos continuado las clases en otro día, pero la profesora lo ha hecho todo en un mismo día al parecer, por lo que ella en esta clase decidió pasar los “TRUE or FALSE” a variables categóricas “Automático”, “Manual” con esto:
  • Y después de eso ya pueden ejecutar el código que hizo la profesora:

RESULTADO:

RECOMENDACIÓN: Cierren el data set y hagan paso a paso lo que he escrito. Espero que sea de ayuda 😄

Es algo nuevo para mi esto de como funciona los automoviles pero segun lo que eh investigado usare los caballos de fuerza con los motores.

Luego hacer el codigo para el boxplot de motor versus los caballos de fuerza
ggplot(mtcars, aes(x = vs, y = hp, fill = vs))
+ geom_boxplot() +
labs(x = “tipo de motor”, y = "Caballos de fuerza ",
title = “Cantidad de potencia del motor”) +
theme(legend.position = “none”) +
theme(panel.background = element_blank(),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank())
Entonces el gráfico que se tiene es el siguiente:

Se observa que los motores V-shaped son los que tienen mayor rendimiento teniendo mas caballos de fuerza.

ggplot(mtcars,aes(x=am,y=mpg,fill=am))+
  geom_boxplot()+
  labs(x="Tipo de caja", y="millas por galón",
       tittle="Millas por galón según tipo de caja-mtcars")+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(), 
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())

#Cambiamos la etiqueta y volvemos a cargar el antetior código
mtcars$am <- factor(mtcars$am, levels=c(TRUE,FALSE),
                    labels=c("Manual","Automático"))

A quién se le hace parecido a las velas Japonesas de trading

En ese ejemplo los carros con 4 cilindrajes alcanzan un promedio por encima de 18 segundos en los que alcanza un cuarto de milla, los de 5 cilindrajes solo un poco por encima de los 18 segundos y los de 6 cilindrajes por debajo de los 18 segundos.

# Boxplot

boxplot(mtcars$hp,
        ylab = 'caballos de fuerza',
        main = 'Caballos de fuerza en carros')

library(ggplot2)

ggplot(mtcars, aes(x=as.factor(cyl), y=hp, fill = cyl))+
  geom_boxplot(alpha = 0.6)+
  labs(x = 'cilindros',
       y = 'caballos de fuerza',
       title = 'Caballos de fuerza segun cilindros')+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())

ggplot(mtcars,aes(x=am,y=mpg, fill=am))+
  geom_boxplot()+
  labs(x='Tipo de caja',
       y='millas por galon',
       title = 'Millas por galon segun tipo de caja')+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())


mtcars$am <- factor(mtcars$am, levels = c(TRUE, FALSE),
                    labels = c('Manual', 'Automatico'))

luego de haber hechos los cambios de falso, verdadero a Manual y Automático me sale el error
Error: Must request at least one colour from a hue palette.
para solucionar volví a cargar la base tmcars y cambiar
de esta forma con 0 y 1 a maunual y automático.
mtcars$am <- factor(mtcars$am, levels = c(1,0),
labels = c(“Manual”,“Automático”))
ejecutar nuevamente y se soluciona

así me quedó a mi

al intentar ejecutar los boxplot con ggplot, me salta este error:
Error: Must request at least one colour from a hue palette.

Cual seria el analisis de la grafica?

Al hacer el boxplot con ggplot tme sale este error
Error: Must request at least one colour from a hue palette.

Millas por galon segun tipo de motor:

mtcars$vs <- factor(mtcars$vs, levels = c(TRUE, FALSE),
                    labels = c("Straight", "V-shaped"))

ggplot(mtcars, aes(x=vs, y=mpg, fill=vs))+
        geom_boxplot()+
        labs(x="Tipo de motor", y="Millas por galon",
             title = "Millas por galon segun tipo de motor")+
        theme(legend.position = "none")+
        theme(panel.background = element_blank(),
              panel.grid.major = element_blank(),
              panel.grid.minor = element_blank())```

Este es mi codigo y me sale este error que pueder ser?
<ggplot(mtcars, aes(x=as.factor(cyl), y=hp,fill=cyl))+
geom_boxplot(alpha=0.6)+
labs(x=“cilindros”, y=“caballos de fuerza”,
title = “test”)+
theme(legend.direction = “none”)+
theme(panel.background = element_blank(),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank())

ERROR: Error in if (!g$title.position %in% c(“top”, “bottom”, “left”, “right”)) stop("title position “”, :
argument is of length zero

Comparto ejercicio paralelo al visto en la clase donde se evalua Cantidad de carburadores por tipo de motor.

ggplot(mtcars.new,aes(x=vs,y=carb, fill=am))+
  geom_boxplot()+
  labs(x="Forma de motor", y="Números de carburador",
       title="Cantidad de carburadores por tipo de motor ")+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())```
<h1>tarea: convierto en factor el atributo la forma del motor: en V o en linea</h1>

mtcars$vs <- factor(mtcars$vs,
levels = c(TRUE, FALSE),
labels = c(“Línea”, “V”))
ggplot(mtcars,
aes(x = vs,
y = mpg,
fill = vs)) +
geom_boxplot() +
labs(x = “Forma del Motor”,
y = “Millas por Galón”,
title = “Millas por Galón según la Forma del Motor”) +
theme(legend.position = “none”) +
theme(panel.background = element_blank(),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank())

¿Podrían orientarme, por favor, para comprender porqué me sale el siguiente error si, según yo, tengo lo mismo que en el video?

> mtcars$am <- factor(mtcars$am, levels=c(TRUE,FALSE),
+                  labels=c("Manual","Automático"))
Error in mtcars$am : $ operator is invalid for atomic vectors

Observación:
Mi código completo es este:

ggplot(mtcars,aes(x=as.logical(am), y=mpg, fill=am))+
geom_boxplot()+
labs(x=“Tipo de caja”, y=“Millas por galón”,
title=“Millas por galón según tipo de caja-mtcars”)+
theme(legend.position = “none”)+
theme(panel.background = element_blank(),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank())

mtcars$am <- factor(mtcars$am, levels=c(TRUE,FALSE),
labels=c(“Manual”, “Automático”))

Declaré x como logical porque de la manera que aparecía en el video no me graficaba los dos boxplots.

Me sale este error haciendo bloxplot, cómo lo puedo solucionar:

ggplot(mtcars,aes(x=as.factor(cyl),y=hp, fill=cyl))+

  • geom_bloxplot()+
  • labs(x=“cilindros”, y=“caballos de fuerza”,
  •    tittle="Caballos de fuerza según cilindros en mtcars")+
    
  • theme(legend.position=“none”)
    Error in geom_bloxplot() : could not find function “geom_bloxplot”

theme(panel.background = element_blank(),

  •   panel.grid.major = element_blank(),
    
  •   panel.grid.minor = element_blank())
    

Peso (lb) segun VS

![](

Hice el boxplot para anállisis de las variables vs (configuración de motor) y hp (caballos de fuerza).

Primero cambie el label de la variable vs con el siguiente código:

mtcars$vs<-factor(mtcars$vs,levels = c(TRUE,FALSE),labels =c(“Motor en V”,“Motor en línea”))

Luego modifiqué el ggplot para agregar los puntos de datos y cambiar el color de los boxplots con el siguiente código:

ggplot(mtcars,aes(x=vs,y=hp,fill=vs))+
geom_boxplot()+geom_jitter()+
labs(x=“Desplazamiento”,y=“Caballos de Fuerza”,
title = “Desplazamiento vs. Caballos de fuerza-mtcars”)+
scale_fill_manual(breaks = c(“Motor en V”, “Motor en Línea”),values=c(“yellow”,“green”))+
theme(legend.position=“none”)+
theme(panel.background=element_blank(),
panel.grid.major=element_blank(),
panel.grid.minor=element_blank())

Adjunto captura de pantalla

![](

https://es.wikipedia.org/wiki/Diagrama_de_caja
para entender un poco mejor los valores del boxplot.

¿POR QUÉ ME APARECE ESTE ERROR?

Hola.
Me sale este error:
Error in bloxplot(mtcars$hp, ylab = “Caballos de Fuerza”, main = “Caballos de fuerza en carros mtcars”) :
no se pudo encontrar la función "bloxplot"
Que debo hacer para este y todos los casos donde me salga este tipo de error?
intente con install.package (boxplot) pero no funciona.

Este es el boxplot que hice:

#boxplot
boxplot(mtcars$hp,
        ylab="caballos de fuerza",
        main="caballos de fuerza en carros mtcars")

#categorica en x y numerica en y
# cajas alargadas nos insinuan datos desviados, cajas chatas datos homogeneos
# cerca al promedio

ggplot(mtcars,aes(x=as.factor(cyl),y=hp,fill=cyl))+
  geom_boxplot(alpha=0.6)+
  labs(x="cilindros",y="caballos de fuerza",
       title="Caballos de fuerza segun cilindros en mtcars")+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())


ggplot(mtcars,aes(x=am,y=mpg, fill=am))+
  geom_boxplot()+
  labs(x="tipo de caja", y="millas por galon",
       title="Millas por galon segun tipo de caja -mtcars")+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())

mtcars$am <- factor(mtcars$am, levels=c("TRUE","FALSE"),
                    labels=c("Manual","Automatico"));```

tengo una duda, solo logro graficar una caja.

ggplot(mtcars, aes(x=am, y=mpg, fill=am))+
geom_boxplot()+
labs(x=‘tipo de caja’, y=‘millas por galon’,
title = ‘millas por galon segun tipo de mtcars’)

Como nota, la grafica de la transmision tiene los valores del eje x invertidos, ya que si revisamos los datos para el maximo de millas por galon de un carro automatico es de 33.9
El cual corresponde graficamente al boxplot rojo ( que en la etiqueta dice ‘Manual’)

El tiempo que tarda en recorrer el 1/4 de milla según las velocidades en la caja de cambios.

![](

Muy buen clase!

<h1>tengo el siguientes error</h1>

Continuous x aesthetic – did you forget aes(group=…)?

#el código es el siguiente
ggplot(mtcars,aes(x=am, y=mpg, fill=am))+ geom_boxplot()+
labs(x=“tipo de caja”,y=“millas por galon”,
title=“Millas por galon segun tipo de caja-mtcars”)+
theme(legend.position = “none”)+
theme(panel.background = element_blank(),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank())

#Solicito ayuda, se agradece!

Si se satura de graficos, y les da error pueden ejecutar en consola: dev.off()
https://stackoverflow.com/questions/20155581/persistent-invalid-graphics-state-error-when-using-ggplot2

A todos al que le salga Error: Must request at least one colour from a hue palette.
tiene que volver a cargar el dataset

mtcars <- read.csv(“ruta”,header=TRUE)

y colocar

mtcars$am <- factor(mtcars$am, levels=c(0, 1),
labels=c(‘Manual’, ‘Automatico’))

ggplot(mtcars,aes(x=as.factor(cyl),y=hp,fill=cyl))+
    geom_boxplot(aes(fill=factor(cyl)),alpha=0.3)+ #cambiamos de color 
    labs(x="cilindros", y="caballos de fuerza",title="Caballos de fuerza segun cilindro")+
    theme(legend.position = "none")+
    theme(panel.background = element_blank(),panel.grid.major=element_blank(),
          panel.grid.minor=element_blank())```
 #################graficas de boxplot###############
  # primer boxplot 
  boxplot(mtcars$hp,
          ylab="caballos de fuerza",
          main="Caballos de Fuerza en carros mtcars")
  
  #box plot con ggplot
  
  ggplot(mtcars,aes(x=as.factor(cyl),y=hp,fill=cyl))+
         geom_boxplot()+
           labs(x="cilindros", y="caballos de fuerza",title="Caballos de fuerza segun cilindro")+
           theme(legend.position = "none")+
           theme(panel.background = element_blank(),panel.grid.major=element_blank(),
                 panel.grid.minor=element_blank())
  
  
  #box plot con ggplot, cambiar de color
  
  ggplot(mtcars,aes(x=as.factor(cyl),y=hp,fill=cyl))+
    geom_boxplot(aes(fill=factor(cyl)),alpha=0.5)+ #cambiamos de color 
    labs(x="cilindros", y="caballos de fuerza",title="Caballos de fuerza segun cilindro")+
    theme(legend.position = "none")+
    theme(panel.background = element_blank(),panel.grid.major=element_blank(),
          panel.grid.minor=element_blank())
  
  #box plot con ggplot, cambiar el grado de  color
  
  ggplot(mtcars,aes(x=as.factor(cyl),y=hp,fill=cyl))+
    geom_boxplot(alpha=0.6)+ #cambiamos grado de color 
    labs(x="cilindros", y="caballos de fuerza",title="Caballos de fuerza segun cilindro")+
    theme(legend.position = "none")+
    theme(panel.background = element_blank(),panel.grid.major=element_blank(),
          panel.grid.minor=element_blank())
  
  # otra variable
  
  ggplot(mtcars,aes(x=am,y=mpg,fill=am))+
    geom_boxplot(alpha=0.6)+ #cambiamos grado de color 
    labs(x="tipo de caja", y="millas pos galon",
         title="Millas por Galón segun tipo de caja mtcars")+
    theme(legend.position = "none")+
    theme(panel.background = element_blank(),panel.grid.major=element_blank(),
          panel.grid.minor=element_blank())
  
  #### cambiar la variable am por variable factor por automatico y manual
  mtcars$am<-factor(mtcars$am,levels =c(TRUE, FALSE),
                    labels = c("Manual","Automático"))```

Pregunta: Por qué el outlier no es el máximo en el boxplot?

Explicación del cambio

Cuando es 0 = Automático y 1 = Falso

Los datos empiezan en 1 , es decir falso

Se utiliza el siguiente código para hacer el cambio entre labels

mtcars$am <- factor(mtcars$am, levels = c(0,1), labels = c("AUTOMATICO", "MANUAL"))

El cambio se hace correctamente y al ver el datasheet se puede ver que empieza en falso , es decir en manual

Finalmente obtenemos la siguiente gráfica

Mi aporte, gracias a todos por sus comentarios me fueron muy útiles:

escribo esto y no me aparece nada, alguien sabra porque?
boxplot(mtcars,aes(x=am, y=mpg, fill=am))+
geom_boxplot()+
labs(x=“tipos de caja”, y=“millas por galon”,
title=“millas por galon segun tipo de caja mtcars”)
theme(legend.position = “none”)+
theme(panel.background = element_blank(),
panel.grid.major = element_blank(),
panel.grid.minor = element_blank())

Queda un poco más prolijo con “theme_classic()”

ggplot(mtcars, aes(x=am, y=mpg, fill=am)) + geom_boxplot() + 
      labs(x="Transmision type", y="miles per gallon", title = "Miles per gallon by transmision type") + 
      theme_classic() 

Cabe destacar de
mtcars$am <- factor(mtcars$am,levels = c(0,1),
labels = c(“Automatico”,“Manual”))
que durante la preparación de los datos debemos analizar la forma en que queremos mostrar los datos por ejemplo para este caso en particular es conveniente tratar la variable am como un factor pues causo conflicto durante la elaboración del boxplot revisar bien la data su estructura y efectuar la respectiva categorizacion