EDA con histogramas.


Para realizar EDA con un histograma dentro de R debemos utilizar la función qplot, los argumentos que debemos pasarle son:

  • la información en el eje X.
  • geom: describir el tipo de gráfica que se va a imprimir.
  • xlab: título para el eje x.
  • main: título de la gráfica.

Además, podemos crear histogramas con el paquete ggplot2 para ello debemos instalarlo: install.packages(“ggplot2”).

A mi se salio un error como el que sigue:
Error in qplot(mtcars$h, geom = “histogram”, xlab = “HP”, main = “Carros segun HP”) : could not find function “qplot”

Para resolverlo tuve que instalar la librería ggplot2:
Después de la instalación, en la sección de “Packages” debes buscar ggplot2 y seleccionarla… fue hasta entonces que me funcionó la función qplot

qplot() = hist()
En la nueva version qplot() fue sustituida por hist()

Bien el ejercicio, pero considero que se debe explicar mejor la estrutura de la funcion, cuantos argumentos puede llevar y el orden.


aes () = contenido estético del gráfico. Es decir, la función le dará indicios a ggplot2 sobre cómo dibujar las formas y tamaños
fill = color de barra
color = contorno de barra
binwidth = ancho de barra
labs () = etiquetas del eje (x,y)
title = nombre del histograma
xlim () = escalas en el eje x
theme () = color de fondo

tener en cuenta que para que el codigo del histograma ejecute o funcione correctamente debe instalar el paquete y la libreria ggplot2. Tambien existe otra funcion sin intalar libreria, aunque un poco mas sencillo el histograma, se llama --> hist(mtcars$hp)


      xlab="Caballos de fuerza",
      main="Carros según caballos de fuerza"

CON ggplot2 👇

Espero que este sea el único curso de Platzi con calidad tan baja, de verdad esta mujer deja todo incompleto, se tiene que buscar demasiada información por fuera generando mucha pérdida de tiempo, energía, motivación e incluso generando un tanto de ira

En realidad el método por defecto para histogramas en R es el comando hist()
este no requiere de la librería ggplot2 ya viene preinstalado, además es que ya viene optimizado con la cantidad de bins y el binswidth que necesita la representación que querramos visualizar.

qplot() ya no existe en las nuevas versiones es hist() quedaria algo asi:

	xlab='caballos de fuerza', 
	main='Carros segun caballos de fuerza',
	col='blue' )

geom ya no existe en hist() y los colores con el parametro col se puede agregar un color diferente para cada barra graficada con un vector tipo:


Si no pueden crear el grafico qplot, ejecuten el siguiente comando para instalarlo: install.packages("ggplot2")

# histograsma mtcars qplot

      geom = "histogram",
      xlab = "caballos de fuerza",
      main = "carros según caballos de fuerza")

ggplot(mtcars, aes(x=hp))+
         labs(x='Caballos de fuerza',
              y='Cantidad de carros',
              title= 'Cabballos de fuerza en carro seleccionados')+
        theme(legend.position = "none")+
        theme(panel.background = element_blank(),
              panel.grid.major = element_blank(),
              panel.grid.minor = element_blank())

ggplot(mtcars, aes(x=hp))+
  geom_histogram(binwidth = 30)+
  labs(x='Caballos de fuerza',
       y='Cantidad de carros',
       title= 'Cabballos de fuerza en carro seleccionados')+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())

ggplot() + geom_histogram(data=mtcars,
                          aes(x=hp), fill = 'blue', color = 'red',
                          binwidth = 20)+
  labs(x='Caballos de fuerza',
       y='Cantidad de carros',
       title= 'Cabballos de fuerza en carro seleccionados')+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())

Clase 17
EDA con Histogramas
En esta clase se explican 3 maneras diferente de graficar en R el mismo histograma del nº de “Caballos de fuerza en carros seleccionados”. Teniendo qplot() y dos opciones desde ggplot().
Ten en cuenta que puedes cambiar:
color de fondo 📉
color de las barras del histograma 🌈
el ancho de las barras 📊
y ajustar la escala de cualquier eje (x,y) 📐

ggplot( , aes(x=))
labs(x=”", y="",


ggplot( , aes(x=))
labs(x="", y="",
theme(legend.position= “none”)+
theme(panel.background = element_blank(), panel.grid.major = element_blank(),
panel.grid.minor = element_blank())


ggplot( ,aes(x=))
theme(panel.background = element_ (), panel.grid.major = element_ (),
panel.grid.minor = element_ ())

ggplot() + geom_histogram(data= ,
aes(x=hp), fill""=, color="",
binwidth =) +
labs(x=, y=,
xlim(c( , ))+
theme(legend.position = “none”)+
theme(panel.background = element. (), panel.grid.major = element_ (),
panel.grid.minor = element_ ())


También se puede hacer un histograma con la función:


Esta función no requiere de una librería como ggplot2.
La diferencia que encontré con la función qplot, fue que utilizar diferentes clases del eje x, es decir, los intervalos que considera en el eje x, para realizar las frecuencias, es diferente. Si alguien pudiera explicar más a fondo esto lo apreciaría mucho.

Otra función que se puede usar para histogramas es : hist

En esta lección hay algunas imprecisiones, como el hecho de que la función qplot() es del paquete base, cuando en realidad es de ggplot2. La función base es hist().

La función hist() arroja un gráfico de este tipo

La función with() permite ingresar una data sin necesidad de especificar las variables en la función destino, como with(mtcars, plot()), donde mtcars es la base de datos a ingresar en plot().

La función theme_bw(), deja el fondo en blanco, con un margen negro, siendo más estético que usar los element_blank().

El resultado del tercer gráfico, que es el que sugiero, es el siguiente

Quizás un poco tarde para el curso, pero R SI DISTINGUE ENTRE MINÚSCULAS Y MAYÚSCULAS cuidado al escribir!

qplot me funciono solo hasta habilitar el paquete ggplot2

qplot funciona hasta importar el paquete:


A estas alturas ya puedo afirmar "qué curso tan malo, solo se dedica a hacer pero no explica las razones de nada!"
Muchas de las cosas que muestra no corren y tiene que andar uno buscando en los comentarios.
Pésimo curso, Platzi.

También se puede usar el comando hist() para crear el histograma.

Buenas noches
No puedo hacer el histograma
Primero me decía que la función qplot no existe, entonces activé el paquete ggplot2 pero ahora me dice q la función geom_histogram no existe.
Que debo hacer?

hist() es la función nativa de R para hacer histogramas.

para la fusione qplot se debe de instalar primero


si se quiere realizar un histograma sin necesidad de ggplot2, se puede realizar con el comando hist:
xlab=“Caballos de fuerza”,
main=“Carros según caballos de fuerza”)

Me di cuenta también que el parámetro breaks de la función hist() permite ver mayor o menor detalle de los grupos si su valor es menor o mayor respectivamente.




Cómo hacer gráficos profesionales en R usando qplot (ggplot2).

Quiero aclarar algunas cosas y errores que me apreciaron, para las personas nuevas les pueda servir 👇👩‍💻

  1. Acerca de este código👇
      geom = "histogram",
      xlab = "caballos de fuerza",
      main = "Carros según caballos de fuerza")  #Quiero decir que me aparece error a la hora que le doy arrancar me sale este error:#

Error in oplot(mtcars$hp, geom = "histogram", xlab = "caballos de fuerza",  : 
  could not find function "oplot"

#Lo que significa lo siguiente:El error indica que no se puede encontrar la función "oplot" en tu entorno de R.#

Muchos dicen que es por la librería ggplot2, pero la verdad es que yo la tenia y aun así me salía el mismo error eso quiere decir que es función para la versión nueva de R ya no funciona-(OJO puede que si les funcione a otras personas, pero en algunos casos no, como en mi caso no me funciono), así que dejo unas alternativas 👇🖇:

     xlab = "caballos de fuerza", 
     main = "Carros según caballos de fuerza")

Por alguna razón les vota error, por la proporciones tan grandes que puede tener la grafica, como me paso a mi, aquí les va otra solución👇:
     xlab = "caballos de fuerza", 
     main = "Carros según caballos de fuerza")

Me funciono ya que si me salió la grafica, espero que les ayude a las personas nuevas que están haciendo este curso por primera vez 👩‍💻🤓💚.

# Create a Histogram
ggplot(mtcars, aes(x=mtcars$hp)) +  
  geom_histogram(bins=30) +
  labs(title="Carros segun caballos de fuerza", 
       x="Caballos De Fuerza(HP)", 
       y="Cantidad (#Carros)") ```

Instalar antes:
Ahi si podrán realizar los histogramas

qplot no funciona en el notebook de Colab, pero hist() es más sencillo:

Recuerden que para usar la funcion qplot(), se tiene que instalar la libreria ggplot2.
Al menos yo lo tuve que hacer.

Tenia este error
Error in qplot(mtcars$hp, geom = “histogram”, xlab = “caballos de Fuerza”, :
could not find function "qplot"
Lo solucioné instalando el paquete ggplot2

nose ustedes, pero para usar qplot tuve que instalar antes la librería ggplot2, asé que todo chamuyo que vamos a hacer histogramas sin librerías…

#Histograma mtcars qplot

      xlab ="caballos de fuerza",
      main ="Carros segun caballos de fuerza")

ggplot(mtcars, aes(x=hp))+
  labs(x="Caballos de fuerza", y="Cantidad de Carros",
      title="Caballos de fuerzos en carros seleccionados")+
  theme(legend.position = 'none')+
  theme(panel.background = element_blank(),panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())

ggplot(mtcars, aes(x=hp))+
  geom_histogram(binwidth = 30)+
  labs(x="Caballos de fuerza", y="Cantidad de Carros",
       title="Caballos de fuerzos en carros seleccionados")+
  theme(legend.position = 'none')+
  theme(panel.background = element_blank(),panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())

  labs(x="Caballos de fuerza", y="Cantidad de Carros",
       title="Caballos de fuerzos en carros seleccionados")+
  theme(legend.position = 'none')+
  theme(panel.background = element_blank(),panel.grid.major = element_blank(),
        panel.grid.minor = element_blank())


Mismo código, 3 gráficos. 1\)gráfico con qplot() o ggplot(): ![]( 2\)gráfico con hist(): ![](
Los histogramas permiten observar: * **Concentración de los datos**: Los rangos con más observaciones indican valores comunes. * **Forma de la distribución**: Puede ser simétrica, sesgada hacia un lado, o tener varias "modas" (multimodalidad). * **Identificación de outliers**: Valores alejados de los demás pueden resaltar diferencias significativas en los datos.
yo use "ggplot2" , que es el paquete actualizado
El primer grafico, ya estaba corriendo bajo el paquete ggplot2

Super desactualizado el curso, hay cambios en R Studio y deberia ser actualizado el curso… punto negativo por esos detalles.

no solo puedo regular la cantidad de bines de mi histograma mediante el parametro binwidth= (indico el ancho de mis bines) sino que tmb puedo regular la cantidad de bins con bins= donde directamente le indico la cantidad de bins

usando ggplot:
ggplot(df, aes(var_numeric) )+geom_histogram()
#funcion por defecto

Utilizando jupyter si lo quieres tienes que utlizar require(ggplot2) y usar la funcion hist() en vez de qplot()

Despues de intentar con install.pac… y directamente desde packages, es imposible instalar ggplot2. que puedo hacer?

da error la primera vez al ejecutar qplot, ésto se soluciona instalando ggplot2

¿como se agregan los printscreens?, la verdad lo intente varias veces pero no apareció la imagen, tambien lo intente con la herramienta de imagen pero sal un apartado de url.

Gracias, buena clase

Pregunta! la ultima funcion que se escribio para agregar colores, se podria iniciar como la explicaron antes? o existe algun problema si no se escribe como esta ultima de colores?

Por que o en que se diferencia que la formula se escriba de maneras diferentes pero con el mismo resultado. (creo)??

ggplot(mtcars, aes(x=hp))+
binwidth = 15)+


aes(x=hp) ,fill=“green”,color=“yellow”,
binwidth = 15)+

Pueden revisar la documentación de la función hist con este comando : ?hist

No es posible instalar el paquete. me sale este error :
Warning in install.packages :
package ‘ggplot’ is not available (for R version 3.5.1)

Estructura de la función qplot:

qplot(x, y, …, data, facets = NULL, margins = FALSE, geom = “auto”,
xlim = c(NA, NA), ylim = c(NA, NA), log = “”, main = NULL,
xlab = NULL, ylab = NULL, asp = NA, stat = NULL,
position = NULL)

Me sale el mismo error de angelica romero

<> qplot(mtcars$mpg,
+        geom = "Histogram", 
+        xlab = "Caballos de fuerza ", 
+        main="Caballos de fuerza de fuerza ")
Error in geom_Histogram() : could not find function "geom_Histogram">

Me salio un error:
Error in geom_Histogram() : could not find function "geom_Histogram"
Me funciono cambiar geom por geom_point

Cuando ejecuto el comando

       xlab = "Caballos de fuerza ", 
       main="Caballos de fuerza de fuerza ")>

Me sale el siguiente error

<> qqplot(mtcars$mpg, geom="Histogram", xlab = "Caballos de fuerza ", ylab = "Fuerza", main="Caballos de fuerza de fuerza ")
Error in sort(y) : argument "y" is missing, with no default
> >

Creo que la función gplot fue reemplazada por “hist”



Al ejecutar el qplot me aparece el siguiente error "Error in geom_Histogram() : could not find function "geom_Histogram"
Que puedo estar haciendo mal?

> qplot(mtcars$hp,
+       geom ="Histogram",
+       xlab ="Caballos de Fuerza",
+       main ="Carros Según HP")
Error in geom_Histogram() : could not find function "geom_Histogram"```

no me reconoce la instrucción binwidth alguien mas tuvoi este problema?
Muchas gracias.

Si no se tiene instalado el paquete ggplot se debe proceder a instalarlo primero, para que lo tengan en cuenta cuando les salga este error "

R version 3.2.2 (2015-08-14) -- "Fire Safety"
Copyright (C) 2015 The R Foundation for Statistical Computing
Platform: x86_64-w64-mingw32/x64 (64-bit)

> library(ggplot2)
Error in library.dynam(lib, package, package.lib) : 
  DLL ‘colorspace’ not found: maybe not installed for this architecture?
In addition: Warning message:
package ‘ggplot2’ was built under R version 3.2.3 
Error: package or namespace load failed for ‘ggplot2’
> qplot(weights, prices, color = types)
Error: could not find function "qplot"

Pude grafica el histograma de mtcars con qplot después de instalar el ggplot2. No olvidar dar check en ggplot2 en packages.

Error in qplot(mtcars$hp) : could not find function “qplot”

Me aparece estoy y ya había descargado ggplot2

Por si tienen problemas con lo de qplot, les dejo esta guía con las 3 formas para instalar

Existen técnicas para medir la cantidad de histogramas y el ancho de las mismas (binwidth), para optimizar la representación de las mismas, generalmente van de 5 (para data sets pequeños) a 20 (para data sets grandes). También se utiliza la raíz cuadrada del total de datos y para el binwidth se utiliza la fórmula:
(valor_máximo - valor_mínimo) / número_de_bins
(valor_máximo - valor_mínimo) / número_de_bins

Por acá dejo mi código

# EDA scatter plot mtcars

mtcars = read.csv(file="mtcars.csv", header=TRUE, sep=",")
orangeec = read.csv(file="orangeec.csv", header=TRUE, sep=",")
plot(mtcars$mpg ~ mtcars$cyl, xlab = "Cilindros", ylab = "Millas por galón", main = "Relación cilindros y millas por galón")
plot(mtcars$hp, mtcars$mpg, xlab = "Caballos", ylab = "Millas por galón", main = "Relación caballos y millas por galón")
plot(orangeec$Unemployment ~ orangeec$Education.invest...GDP, xlab = "Inversion Educación (%PIB)", ylab = "Desempleo", main = "Relación Inversion en Educación y Desempleo")
plot(orangeec$GDP.PC ~ orangeec$Creat.Ind...GDP, xlab = "Aporte Economia Naranja al PIB(%)", ylab = "PIB Per Cápita", main = "Relación Economia Naranja y PIB Per Cápita")

# Histogramas

data <- hist(mtcars$hp, xlab = "Caballos de fuerza", col = "green", main = "Carros según caballos de fuerza")
text(data$mids, data$counts, labels=data$counts, adj=c(0.5,-0.5))

Yo use las funciones hist() y text() para colocar el número de carros en cima de cada barra de la gráfica.

Más info en:

Cuando intenté usar la function qplot(), sin ninguna dependencia, R Studio arrojó que no la encontró. Es posible que esté DEPRECATED.

Cuando pone el fondo blanco no sobraría la función theme(legened.position = “none”) o siempre se debe ponerla?

Sin instalar nada… aquí nada puede malir sal :v
install.packages(“ggplot2”); library(ggplot2)

Tengo un problema

Error in qplot(mtcars$hp, geom = "histogram") : 
  no se pudo encontrar la función "qplot"```