Bienvenida e introducción

1

Todo lo que aprenderás sobre el lenguaje R

2

Programación y Data Science

3

R y proyecto economía naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros cálculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qué es EDA: Exploratory Data Analysis

14

Gráficas de dispersión e histogramas.

15

Box Plot y su interpretación

16

EDA con dataset proyecto - Gráficas de dispersión.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gráficas de dispersión con más de dos variables - ggplot2

22

EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly

La estadística de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la función cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la función cor en dataset proyecto.

27

Protegiéndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los cálculos.

29

Estadística y visualización aplicada a análisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualización

32

Viendo más información con facet wrap - Parte 1

33

Viendo más información con facet wrap - Parte 2

Organizar visualizaciones y código con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.

Conclusiones Finales

35

Invitación a continuar recorriendo el mundo del data science.

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly

22/35
Recursos

Aportes 194

Preguntas 17

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Les aconsejo que para no escribir las variables de memoria hagan por ejemplo
orangeec$Internet.penetration
Luego del “$” R te muestra las opciones que puedes poner y no modifica la sintaxis en absoluto

Adjunto captura y código de grafico con ggplotly donde al pasar el puntero nos da los datos y el nombre del país

my_graph2<-ggplot(orangeec,aes(Internet.penetration...population,
                              Creat.Ind...GDP,label=Country))+
  geom_point()+
  labs(x="Penetration Internet",y="Aporte economía naranja",
       title = "Penetración Internet y aporte economía naranja")

my_graph2

p1=ggplotly(my_graph2)
p1```

C L A S E ✌✌
.
EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly
.
.
En esta clase hay un RETO 💪🙂 con el dataset orangeec y dos nuevas funciones para hacer un scatter plot interactivo desde un nuevo paquete llamado plotly
.
RETO 💪🙂
RELACIONAR CUATRO VARIABLES DEL DATASET orangeec EN UN SCATTER PLOT

.
Las cuatro variables para el RETO 💪🙂 son:
.
1.- Education.invest…GDP es inversiòn en educaciòn como porcentaje % del PIB
.
2.- Unemployment es desempleo
.
3.- Strong_economy es paises que estan por debajo del promedio de PIB
per capita y los que estan por encima del promedio
.
4.- X…pop.below.poverty.line es porcentaje % de la poblacion que esta
por debajo de la linea de pobreza
.
C O D I G O

👇👇👇

ggplot(orangeec, aes(Education.invest…GDP,Unemployment))+
geom_point(aes(color=Strong_economy, size=X…pop.below.poverty.line))+
labs(x=“Inversion en educaciòn”, y=“Desempleo”,
Title=“Relaciòn entre inversiòn en educaciòn y desempleo segun
el % de la poblaciòn que esta por debajo de la linea de pobreza”)
.


.

Lo visto en el grafico es la “Relaciòn entre inversiòn en educaciòn y
desempleo segun el porcentaje % de la poblaciòn que esta por debajo de la linea de pobreza”
:
.
En el eje x se encuentra la inversiòn en educaciòn como porcentaje % del PIB como Education.invest…GDP
.
En el eje y esta el desempleo como Unemployment
.
El color de las esferas depende de si el pais esta por debajo del promedio de PIB per capita o si esta por encima del promedio se ve con la etiqueta Strong_economy
.
El tamaño de cada esfera depende del porcentaje % de la poblacion que esta por debajo de la linea de pobreza se ve con la etiqueta X…pop.below.poverty.line
.
.
SCATTER PLOT INTERACTIVO
ACTIVANDO install.package(“plotly”) Y DECLARANDO my_graph, p
.
¡Esta funcion permite que al posicionar el puntero en alguna esfera de la grafica se vea mas informacion del dato! 💃
.
1.- Instalamos el paquete plotly:

install.package(“plotly”)
library(plotly)
.

2.- Procedemos con my_graph
Para pautar la informacion que se muestra al posicionar el puntero sobre la esfera:
.
my_graph <- ggplot(orangeec, aes(Internet.penetration…population,
Creat.Ind…GDP, label=row.names(orangeec)))+
geom_point()+
labs(x=“Penetracion de internet”, y= “Aporte de la economia naranja al PIB”,
title=“Penetracion de internet en la poblacion y
aporte de la economia naranja al PIB”)
.
3.- Y despues con p
Para que nos muestre la informacion al puntear sobre la esfera
p = ggplotly (my_graph)
p
.
Para este ejercicio la informacion que se ve al posicionar el puntero sobre la esfera es:
.
Internet.penetration…population que es la penetracion de internet en la poblacion
.
Creat.Ind…GDP que es el aporte de la economia naranja al PIB
.
row.names(orangeec) que es el nombre de cada pais en el dataset orangeec
.
C O D I G O
👇👇👇
my_graph <- ggplot(orangeec, aes(Internet.penetration…population,
Creat.Ind…GDP, label=row.names(orangeec)))+
geom_point()+
labs(x=“Penetracion de internet”, y= “Aporte de la economia naranja al PIB”,
title=“Penetracion de internet en la poblacion y
aporte de la economia naranja al PIB
”)
my_graph
.
p = ggplotly(my_graph)
p
.

.
Informacion al posicionar el puntero sobre la esfera:
.
Penetracion de internet
Internet.penetration…population: 69.7
.
Aporte de la economia naranja al PIB
Creat.Ind…GDP: 6.3
.
Numero de fila en la que esta en nombre del pais
row.names(orangeec): 14

Para no tener que escribir toda la variable, se puede pegar del listado que sale de:

colnames(orangeec)

El paquete “plotly”, sirve para hacer nuestros gráficos interactivos, en el ejemplo de esta clase he decidido cambiar label del plot, por el nombre de los países, así cuando pasemos el mouse podemos ver directamente el país y no el índice del país.

library(plotly)
my_graph <- ggplot(orangeec, aes(Internet.penetration...population,
                              Creat.Ind...GDP, label=orangeec$Country))+
  geom_point()+
  labs(x="Penetración Internet", y="Aporte economia naranja",
       title = "Penetración Internet y aporte economia naranja")
my_graph
p = ggplotly(my_graph)
p

Al poner Country en label directamente te muestra el nombre del pais yno el numero…

my_graph <- ggplot(orangeec, aes(Internet.penetration…population,
Creat.Ind…GDP,label=Country))+
geom_point()+
labs(x=“Pentracion internet”, y=“aporte economia naranja”,
tittle=“Internet y aporte eco naranja”)
my_graph

p = ggplotly(my_graph)
p

Si instalaron R junto con anaconda, posiblemente les de un error al usar Plotly, instalen la última versión de R y RStudio junto con el siguiente paquete:

install.packages(“devtools”)
require(“devtools”)

Alguien sabe cómo hacer que en la gráfica de 4 valores salga el nombre de los puntos de colores, gracias

![](

Reto con popup

my_graph <- ggplot(orangeec, aes(x=Education.invest...GDP, y=Unemployment, label=Country))+
               geom_point(aes(color=factor(Strong_economy), size=X..pop.below.poverty.line)) +
               labs(x="Inversion de la Edución PIB %", 
                    y="Desempleo %", 
                    title="Inversion en Educación y Desempleo según Economía y población por debajo de la linea de pobreza")
       
p = ggplotly(my_graph)

Reto

ggplot(orangeec, aes(Education.invest...GDP,Unemployment))+
geom_point(aes(color=factor(Strong_economy), size=X..pop.below.poverty.line))+
labs(x="Inversión en educación % PIB",
     y="Desempleo",
     title="Inversión en Educación y desempleo según economía y población por debajo de la línea de pobreza"
)
ggplot(orangeec, aes(`InverEduca%GDP`, Unemployment))+
  geom_point(aes(color=factor(Strong_economy), size=`% pop below poverty line`))+
  labs(x="Inversion educacion", y="Desempleo",
       title = "Inversion en educacion y desempleo")

Buenos días, continuo con el problema de la paqueteria ggplot2, instalé las paqueterias rlang y stringi y otras soluciones que encontre en la comunidad de Rstudio pero ninguna ha funcionado hasta el momento. ¿Podrian ayudarme a solucionar este problema?

I took time to find this, change the tooltip's labels. But it looks better to me. :D ![](https://static.platzi.com/media/user_upload/Captura%20de%20pantalla%202024-03-07%20a%20las%2018.10.26-b3fd269b-5744-4024-b5cd-c2fe37ba556c.jpg) ```txt fig <- plot_ly(data = orange, x = ~Internet.penetration...population, y = ~Creat.Ind...GDP, text = ~paste("Internet Penetration (%): ", Internet.penetration...population, '
Creative Index (% of GDP):', Creat.Ind...GDP)) fig <- fig %>% layout(title = 'Relation internet penetration and Creative Index', xaxis = list(showgrid = FALSE,title = "Internet Penetration (%)"), yaxis = list(showgrid = FALSE,title = "Creative Index (% of GDP)")) fig ```Look for the documentación in Plotly and enhance your plots: <https://plotly.com/r/>
![](https://i.imgur.com/N2FDS7b.png)
Para ver el nombre en lugar de su número, se puede escribir ```js label = Country ``` en lugar de ```js label = row.names(orangeec) ```

la imagen de la relación entre educación inversion y el desempleo.
https://drive.google.com/file/d/1RDH3fC_oOFOhQ_QdGFHLBoOQC_0ns7Ri/view?usp=sharing

mi aporte. # Datos
education_invest <- c(5.9, 7.4, 7.3, 5.9, 4.9, 4.5, 7.1, 5, 3.5, 2.8, 5.9, 5.3, 4.5, 3.2, 5, 3.8, 4.4)
unemployment <- c(8.1, 10.1, 4, 11.8, 7, 10.5, 8.1, 4.6, 7, 2.3, 5.9, 3.6, 6.5, 5.5, 6.5, 6.7, 7.3)
strong_economy <- c(“A”, “B”, “A”, “B”, “A”, “B”, “A”, “B”, “A”, “B”, “A”, “B”, “A”, “B”, “A”, “B”, “A”)

Crear un data frame con los datos

data <- data.frame(Education_invest_GDP = education_invest, Unemployment = unemployment, Strong_economy = strong_economy)

Cargar el paquete ggplot2

library(ggplot2)

Crear el gráfico de dispersión con colores

ggplot(data, aes(x = Education_invest_GDP, y = Unemployment, color = Strong_economy)) +
geom_point() +
labs(x = “Educación inversión % PIB”, y = “Desempleo”,
title = “Relación entre Educación inversión % PIB y Desempleo”)

Tuve un rollo con el nombre de las columnas que tenían espacio, la solución es que deben ir en comillas:

ggplot(orangeec, aes(`Education invest % GDP`, Unemployment ))+
  geom_point(aes(color=factor(Strong_economy), size= `% pop below poverty line`))+
  labs(x='Inversión en Educación (%) PIB', y='Desempleo',
       title='Inversión en Educación como (%) PIB y El Desempleo')

Así me quedó el reto:

ggplot(orangeec, aes(Education.invest...GDP,Unemployment))+
  geom_point(aes(color=factor(Strong_economy), size = `X..pop.below.poverty.line`))+
  labs(x = "Inversión de eduación como %PIB", y="Desempleo",
       title ="Inversión en educación, población debajo de la línea de pobreza, desempleo y crecimiento PIB")

Para identificar el nombre del país en las etiquetas cuando se vuelve interactivo el gráfico es mejor asignarle a label la columna “Country” y no la columna “row.names” de esa forma va a mostrar el nombre del país y no el número que ocupa en la base de datos y no va a ser necesario tener que ir a la base de datos a identificar el país por el número que le corresponde.

Mi solucion:

ggplot(orangeec,aes(Education.invest…GDP,Unemployment))+
geom_point(aes(color=factor(Strong_economy),size=X…pop.below.poverty.line))+
labs(x=“Inversion de educacion”,y=“Desempleo”,
title=“Internet y aporte economia naranja, economia y crecimiento PIB”)

  • Para no escribir todo el nombre yo escribo esta linea para que me saque todos los nombres y poder copiarlos:

colnames(orangeec)

Visualización de Scartte plot con efecto ploty con variables del dataset orangeec:

# Scatter plot con efecto de ploty
my_graph <- ggplot(orangeec, aes(Internet.penetration...population,
            Creat.Ind...GDP, label=row.names(orangeec)))+
            geom_point()+
            labs(x='Penetración Internet', y='Aporte economía naranja',
                 title='Penetración Internet y Aporte economía naranja')
my_graph

p = ggplotly(my_graph)
p

Comparto visualización del reto Scatter plot con 4 variables del dataset orangeec:

# Scatter plot con ggplot orangeec Reto ( 4 variables)

ggplot(orangeec, aes(Education.invest...GDP, Unemployment ))+
  geom_point(aes(color=factor(Strong_economy), size= X..pop.below.poverty.line))+
  labs(x='Inversión en Educación (%) PIB', y='Desempleo',
  title='Inversión en Educación como (%) PIB y El Desempleo')

Comparto visualización del siguiente ejercicio:

# Scatter plot con ggplot orangeec
ggplot(orangeec, aes(Internet.penetration...population, Creat.Ind...GDP ))+
  geom_point(aes(color=factor(Strong_economy), size= GDP.Growth..))+
  labs(x='Penetración Internet', y='Aporte economía naranja PIB',
  title='Internet y aporte economía naranja según economía y crecimiento PIB')

No pude hacer el gráfico interactivo por que me dice que debo actulizar los vctrs a 0.5.2 pero no me deja actulizalo de ninguna manera ni intalando de nuevo los programas.

Como reto personal decidí realizar EDA a la data set de mtcars, y para volverlo más interesante me hice la pregunta ¿qué tipo de carro debo comprar para hacer un 1/4 de milla lo más rápido posible?, la pregunta parece fácil, pero viendo solo números no lograba extraer el conocimiento que necesitaba, como resultado de la exploracion por fin llegue a la siguiente gráfica, no hubiese llegado a esa grafica si no tuviera un objetivo de responder una pregunta especifica , es algo que me parece importante compartir con ustedes compañeros .


s = tipo de motor straight
v = tipo de motor v-shaped
numero = cantidad de cilindros

 # transformations
mtcars_eda <- data.frame(mtcars)
mtcars_eda$wt <- mtcars_eda$wt*1000/2.2
mtcars_eda$am <- as.logical(mtcars_eda$am) 
mtcars_eda$am <- factor(mtcars_eda$am,
                    levels = c(TRUE,FALSE),
                    labels = c("manual","automatico")) 
mtcars_eda$vs <- as.logical(mtcars_eda$vs)
mtcars_eda$vs <- factor(mtcars_eda$vs,
                        levels = c(TRUE,FALSE),
                        labels = c("straight","v-shaped"))

engine_type <- ifelse(mtcars_eda$vs == "v-shaped" & mtcars_eda$cyl == 8,"v8",
                   ifelse(mtcars_eda$vs == "v-shaped" & mtcars_eda$cyl == 6,"v6",
                          ifelse(mtcars_eda$vs == "v-shaped" & mtcars_eda$cyl == 4,"v4",
                                 ifelse(mtcars_eda$vs == "straight" & mtcars_eda$cyl == 6,"s6","s4"))))        
mtcars_eda <- cbind(mtcars_eda,engine_type)
# box plot engine_type vs quarter time
ggplot(mtcars_eda,aes(x=engine_type,
                      y=qsec,
                      fill=engine_type))+
  geom_boxplot(alpha=0.6)+
  labs(x="tipo de motor",
       y="tiempo 1/4 de milla",
       title = "1/4 de milla segun tipo de motor")+
  theme(legend.position = "none")+
  theme(panel.background = element_blank(),
        panel.grid.major =element_blank(),
        panel.grid.minor = element_blank())

Adjunto reto

Hola a todos les muestro como me quedo la grafica del reto planteado.

Hola!

Mi aporte al reto

ggplot(orangeecc, aes(orangeecc$Education.invest...GDP,orangeecc$Unemployment))+
  geom_point(aes(color=orangeecc$Strong_economy, size=orangeecc$X..pop.below.poverty.line))+
  labs(x="Inversión en educación %PIB", y = "Desempleo", 
       title="Inversión en Educación y Desempleo según economia")

Que interesante los paquetes que tiene R en serio ayudan mucho a la visualización.

Mi aporte

 ggplot(orangeec, aes(Education.invest...GDP, Unemployment))+
    geom_point(aes(color=factor(Strong_economy), size=orangeec$X..pop.below.poverty.line))+
    labs(x="Porcentaje del pib de inversión en educación", y="Desempleo",
         title = 'Educacion y su aporte a la erradicación del desempleo')
  

Les dejo mi scartterplot del ejercicio 👇


Y el código, por supuesto 🤖

ggplot(orangeec, aes(Education.invest...GDP,Unemployment))+
geom_point(aes(color=factor(Strong_economy),size=X..pop.below.poverty.line))+
  labs(x="% Inversión en educación", y="Desempleo",
       title="Relación de desempleo e inversión de GDP en educación")

#########Reto
ggplot(orangeec ,aes(Education.invest…GDP,Unemployment))+
geom_point(aes(color=factor(Strong_economy), size=X…pop.below.poverty.line))+
labs(x=“Inversión en educación”,
y= “Desempleo”,
title =“Aporte a la educación y desempleo”)

Instalación plotly (GNU/Linux)

Tuve algunos errores con dependencias como httr y curl durante la instalación de plotly.

Solución:
Primero, desde la terminal del sistema operativo instalar las siguiente librerías:

sudo apt-get install libssl-dev libcurl4-openssl-dev

Luego la instalación de plotly no tiene problemas:

install.packages("plotly")

Para el scatted plot interactivo, es mejor colocar directamente la columna del país (label=Country) en lugar de label=row.names(orangeec), para visualizar directamente los paises al colocar encima el cursor

Adjunto reto:

<ggplot(orangeec, aes(orangeec$Education.invest...GDP, orangeec$Unemployment))+
  geom_point(aes(color=Strong_economy, size=orangeec$X..pop.below.poverty.line))+
  labs(x="Inversión en educación", y ="Desempleo",
       title="Inversion en educación y desempleo según economia y población por debajo de la linea de pobreza")

ggplot(orangeec,aes(Education.invest…GDP,Unemployment))+
geom_point(aes(color=factor(economia_fuerte),size=X…pop.below.poverty.line))+
scale_color_manual(values=c("#325F8C","#EA6D20","#64AC59"))+
labs(x=“Inversión en educación”,y=“Desempleo”,
title=“Inversión y desempleo según el porcentaje de la población que esta por debajo de la linea de pobreza”)+
theme(legend.position = “top”)

Un poco diferente, solo le cambie los colores y agregue que las leyendas se leyeran arriba!![

EJERCICIO 4:40

ggplot(orangeec, aes(Education.invest…GDP,Unemployment))+
geom_point(aes(color=factor(Strong_economy),size=X…pop.below.poverty.line))+
labs(x=“inversion en educacion”,
y=“desempleo”,
title=“Relacion entre inversion en educacion y
desempleo segun el % de la poblacion que esta por
debajo de la linea de pobreza”)

ggplot(orangeec, aes(Education.invest…GDP, Unemployment)) +
geom_point(aes(color=Strong_economy, size= X…pop.below.poverty.line))+
labs(x="% de inversión del PIB en educación", y= “% de desempleo”,
title=“inversión en educación y desempleo x tipo de economía y linea de pobreza”)

Dejo el reto de las 4 variables:
Relación de la inversión y Desempleo según La economía y nivel de pobreza

Si en lugar de row.names ponto el nombre de una columna luego de label= entonces puedo por ejemplo ver directamente el nombre de los paises al pasar el cursor:

# Forma para ver el nombre del pais directamente al pasar el cursor sobre el punto

my_graph <- ggplot(orangeec, aes(x=Internet.penetration...population,
                                 y=AporteEcNja,
                                 label=Country))+
  geom_point()+
  labs(x="Penetración internet",
       y="Aporte de economía naranja",
       title="Internet y aporte de economía naranja")

my_graph # Corro la grafica pero aún no veo nada. Debo guardar la variable en otra usando ggplotly

my_graph = ggplotly(my_graph)
my_graph

RETO;
No logré subir la imagen pero acá está el código

ggplot(orangeec, aes(Education.invest…GDP,Unemployment))+
geom_point(aes(color=factor(Strong_economy), size=X…pop.below.poverty.line))+
labs(x=“Inversion en educacion”, y=“Desempleo”,
title=“Inversion en educacion y desempleo según ec y crecimiento pib”)

ggplot(orangeec, aes(Education.invest…GDP,Unemployment))+
geom_point(aes(color=factor(Strong_economy),
size=X…pop.below.poverty.line))+
labs(s=“Education.invest…GDP”, y=“Unemployment”,
title ="")

ggplot(orangeec, aes(Education.invest…GDP, Unemployment))+
geom_point(aes(color= factor(Strong_economy) ,size=X…pop.below.poverty.line))+
labs(x=“Inversion en Educacion”, y=“Desempleo”,
title= “Relacion inversion en Educacion y desempleo”)

Incluyo el gráfico del reto

solo hice una modificación en el código, donde modifico las etiquetas de las filas, para no andar viendo el número. La función para ese cambio es row.names() y solo selecciono la columna 1 de la base de datos, la cual contienen los nombres de los países.

![](

Aporte de Solucion, me va gustando y mucho R… dirian ustedes que es como un lenguaje de programacion? no lo siento tan complejo como otros que llevo.

## El reto :v

ggplot(orangeec, aes(Education.invest...GDP,Unemployment))+
  geom_point(aes(color=factor(Strong_economy), size=X..pop.below.poverty.line))+
  labs(x='Inversión Educación (%PIB)', y='Desempleo',
       title='Inversión en Educación y Desempleo según economía y % por debajo de Pobreza',
       color='Solidez Económica', size='% por debajo de Pobreza')

ggplot(orangeec, aes(Education.invest…GDP, Unemployment))+
geom_point(aes(color=factor(strong_economy), size=X…pop.below.poverty.line))+
labs(x=“Penetracion internet”, y=“Desempleo”,
title = “Penetracion internet-Desempleo según econ y poblacion x debajo linea de pobreza”)

Hola a todos.
Comparto mi gráfica.

Reto de la clase

Para ponerle etiquetas a color y a size podemos agregarle estos parámetros a la función labs:

ggplot(...)+geom_point(...)+labs(x="..",y="...",color ="PIB superior a la media",size="PIB percápita",

RESULTADO DE TAREA
INVERSIÓN DE EDUCACIÓN POR DESEMPLEO DE BAJO DE LA LINEA DE POBREZA

Comparto aquí la gráfica que indico la profesora:

ggplot(orangeec, aes(x = Education.invest...GDP, 
                     y = Unemployment)) +
  geom_point(aes(color = factor(Strong_Economy),
                 size = X..pop.below.poverty.line), alpha = 0.6) +
  labs(x = "Inversión en Educiación",
       y = "Tasa de Desempleo ",
       color = "Fortaleza Económica",
       size = "Nivel de Pobreza",
       title = "Inversión en Educación y Tasa de Desempleo, 
          segun Economía y Pobreza")

Reto GGPLOT

ggplot(orangeec, aes(Education.invest...GDP,Unemployment))+
  geom_point(aes(color=factor(Strong_economy), size=X..pop.below.poverty.line))+
  labs(s="Inversion en educacion", y="Desempleo",
       title="Inversion en educacion a la economia naranja y desempleo")```


Este es el reto de la profesora 
<code>
ggplot(orangeec, aes(Education.invest...GDP,Unemployment))+
  geom_point(aes(color=factor(Strong_economy), size=X..pop.below.poverty.line))+
  labs(x="Invesión de la Educación", y= "Desempleo", title="Inversión de la educación y desempleo")

alguien a intentando hacer interactivo el plot con 4 variables? yo lo intente y me funciona bien pero para mostrar los datos no me aparecen las 4 variables que estoy utilizando en la grafica se ve asi

ggplot(orangeec, aes(Education.invest…GDP, Unemployment))+
geom_point(aes(color=factor(strong_economy), size=X…pop.below.poverty.line))+
labs(x=“Inversion en educación”, y=“Desempleo”,
title=“Relación entre inversión en educación y tasa de desmpleo”)

# SCATTER PLOT
ggplot(orangeec, aes(Education.invest...GDP, Unemployment)) +
  geom_point(aes(color = Strong_economy, size = X..pop.below.poverty.line)) +
  labs(x = "Inversion en educacion %PIB", y = "Porcentaje de desempleo", title = "Educacion vs Desempleo segun economia y poblacion por debajo de la linea de pobreza")
#
ggplot(orangeec,aes(Education.invest...GDP,Unemployment))+
  geom_point(aes(color=factor(Strong_economy), size=X..pop.below.poverty.line))+
  labs(title = "INVERSIÓN EN EDUCACIÓN Y DESEMPLEO SEGUN INGRESOS Y LÍNEA DE POBREZA",
       subtitle = "Análisis para paises de América Latina",
       x="Inversión en Educación (%PIB)", 
       y="Tasa de Desempleo (%)",
       color="PBI Per Cápita", 
       size="Tasa de pobreza poblaciónal",
       caption = "(Basado en el data set orangeec.cvs)"
       )

ggplot(orangeec, aes(x=Education invest % GDP,y=Unemployment)) +
geom_point(aes(color = factor(Strong_economy),
size = % pop below poverty line)) +
labs(x = “Inversion en Educación”,
y = “Desempleo”,
title = “Inversion en Educacion vs Desempleo segun nivel de economia y linea de pobreza”)

Mi reto!

#scatter plot de 4 variables orangeec
ggplot(orangeec, aes(`Education invest % GDP`,`Unemployment`))+
  geom_point(aes(color=factor(Strong_economy), size=`% pop below poverty line`))+
  labs(x="Inversión en educación (% PIB)", y="Desempleo",
       title="Inversión en educación (% PIB) y desempleo
       según economía y población por debajo de la linea de pobreza")

El script de mi reto.

<ggplot(OrE, aes(x=Education.invest...GDP, y=Unemployment))+
  geom_point(aes(color=factor(Strong_Economy),size=X..pop.below.poverty.line))+
  labs(x="Education investment (%)", y="Unemployment (%)",
       title="Relationship education investment and unemployment"))>

Si se convierten los nombres de los paises en el nombre de las filas, es posible visualizar el nombre del pais en la figura obtenida con el ggplotly.

rownames(OrE)<-OrE$Country
OrE<-OrE[,-1]

Hola Sonia

¿como podria etiquetar directamente cada punto del scaterplot?eso facilita más la interpretación

reto:

ggplot(orangeec, aes(Education.invest…GDP,Unemployment))+
geom_point(aes(color=factor(Strong_economy), size=X…pop.below.poverty.line))+
labs(x=“Inversión en educación como % del PIB”, y=“Desempleo”,
title=“Inversión en educación y desempleo segun el nivel
de economia y el % de poblacion por debajo de la linea de pobreza”)

)

![](

RETO:
ggplot(orangeec, aes(orangeec$Education.invest…GDP,orangeec$Unemployment))+
geom_point(aes(color=factor(orangeec$strongeconomy), size=orangeec$X…pop.below.poverty.line))+
labs(x=“Inversion de edudacion PIB”, y=“Porcentaje de desempleo”, title = “Relacion de la inversion de la educacion y el desempleo RTV”)

Hola buenos días.

En la base de datos de economía naraja no aparece strong economy. revise en la fuente del archivo en github.

![](

respusta al reto

ggplot(orangeec, aes(Education.invest...GDP, Unemployment))+
  geom_point(aes(color=factor(Strong_economy), size=X..pop.below.poverty.line))+
  labs(x="Inversión en Educación %PIB", y="Desempleo",
       title="Inversión en Educación y Desempleo según economía y Nivel de Desempleo")

ggplot(orangeec, aes(Education.invest...GDP,Unemployment))+
  geom_point(aes(color=factor(Strong_economy), size=X..pop.below.poverty.line))+
  labs(x="Inversion Educacion porcentaje PIB(%)", y="Desempleo",
       title="Educacion y Desempleo segun economia y poblacion por debajo de linea de pobreza")```
<ggplot(OrE, aes(x=Education.invest...GDP, y=Unemployment))+
  geom_point(aes(color=factor(Strong_Economy),size=X..pop.below.poverty.line))+
  labs(x="Education investment (%)", y="Unemployment (%)",
       title="Relationship education investment and unemployment")>

Tengo un problema, al instalar plotly me se instalaron otras librerias y ya se pudo instalar la ggplo2, me sale este anuncio

Warning in install.packages :
  running command '"C:/PROGRA~1/R/R-33~1.2/bin/x64/R" CMD INSTALL -l "C:\Users\JC\Documents\R\win-library\3.3" C:\Users\JC\AppData\Local\Temp\RtmpQ7IAx9/downloaded_packages/ggplot2_3.1.1.tar.gz' had status 1
Warning in install.packages :
  installation of package ‘ggplot2’ had non-zero exit status

ggplot(orangeec,aes(Education.invest…GDP,Unemployment))+
geom_point(aes(color=factor(Strong_economy),size=X…pop.below.poverty.line))+
labs(x=“PInversion de educaion en %”,y=“Desempleo”,
title=“Inversion en la educacion y Desempleo segun economia y porcentaje de la poblacion por debajo de la linea de pobreza”)

Reto:.

ggplot(orangeec, aes(Education.invest...GDP, Unemployment))+
  geom_point(aes(color=factor(Strong_economy), size=X..pop.below.poverty.line))+
  labs(x="Inversión educación (%) PIB", y="Desempleo",
       title="(%) PIB invertido en eduación y desempleo")```
<h1>reto</h1>

ggplot(orangeec, aes(x = Education.invest…GDP,
y = Unemployment)) +
geom_point(aes(color = factor(stron_econ), size = X…pop.below.poverty.line)) +
labs(x = “Inversion en educacion % PIB”,
y = “desempleo”,
title = “% del PIB invertido en educacion vs desemeplo”)

Tengan cuidado con los espacios nombres de las variables:


ggplot(orangeec,aes(Education.invest...GDP,Unemployment))+
  geom_point(alpha=0.7,aes(color=factor(Strong_Economy),size=X..pop.below.poverty.line))+
  labs(x="Inversión en Educación",y="Desempleo",
       title="Inversión en Educacion y Taza de Desempleo según Economía y Taza de Pobreza")

Por acá dejo el reto:
Código

Gráfico