Bienvenida e introducci贸n

1

Todo lo que aprender谩s sobre el lenguaje R

2

Programaci贸n y Data Science

3

R y proyecto econom铆a naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros c谩lculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qu茅 es EDA: Exploratory Data Analysis

14

Gr谩ficas de dispersi贸n e histogramas.

15

Box Plot y su interpretaci贸n

16

EDA con dataset proyecto - Gr谩ficas de dispersi贸n.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gr谩ficas de dispersi贸n con m谩s de dos variables - ggplot2

22

EDA con dataset proyecto usando gr谩ficas de dispersi贸n con m谩s de dos variables - ggplot2 - plotly

La estad铆stica de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la funci贸n cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la funci贸n cor en dataset proyecto.

27

Protegi茅ndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los c谩lculos.

29

Estad铆stica y visualizaci贸n aplicada a an谩lisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualizaci贸n

32

Viendo m谩s informaci贸n con facet wrap - Parte 1

33

Viendo m谩s informaci贸n con facet wrap - Parte 2

Organizar visualizaciones y c贸digo con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del an谩lisis en un documento PDF.

Conclusiones Finales

35

Invitaci贸n a continuar recorriendo el mundo del data science.

No tienes acceso a esta clase

隆Contin煤a aprendiendo! 脷nete y comienza a potenciar tu carrera

Tipos de datos

6/35
Recursos

Adem谩s de trabajar con el dataset de Orange Economy vamos a necesitar el dataset de mtcars.

Dentro de la consola de R Studio, la funci贸n install.packages nos va a ayudar a instalar paquetes, como su nombre lo indica, en este caso intentaremos instalar mtcars.

En caso de no estar disponible para tu versi贸n de R, puedes ir al Github de la profesora y descargarlo.

La funci贸n str nos va a mostrar la estructura que tiene el dataset que le pasemos.
Dentro de la consola podemos obtener m谩s informaci贸n sobre nuestro dataset anteponiendo el signo ? quedando ?mtcars

En el dataset mtcars podemos ver que hay datos de tipo int y num, la diferencia es que num son n煤meros con decimal mientras que int son enteros.

Podemos ver que las variables vs y am dentro de mtcars aunque est谩n marcadas con int su funci贸n es de tipo boolean, para convertir estos datos utilizaremos la funci贸n as.logical

Reto: Explora la estructura del dataset orangeec. Escribe en los comentarios el n煤mero de observaciones y variables que encuentres.

Aportes 327

Preguntas 31

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad?

o inicia sesi贸n.

17 obs. y 13 variables. Hay que tener cuidado a la hora de importar el Dataset porque viene con la opci贸n Header por defecto en No, y esto hace que los t铆tulos los tome como una observaci贸n m谩s, lo cual no es correcto. Hay que poner el Header en Yes para que tome los t铆tulos de las variables correctamente

Puedes hacer notas con #

#Informaci贸n sobre mtcars
?mtcars
#Clase de la variable vs
class(mtcars$vs)

#Convertir el tipo de la variable
mtcars$vs = as.logical(mtcars$vs)
mtcars$am = as.logical(mtcars$am)
class(mtcars$vs)
class(mtcars$am)

Para conocer la estructura de un dataset, utilizamos la funci贸n str() (que significa structure o estructura), pasandole como par谩metro el nombre del dataset en cuesti贸n.

En la informaci贸n arrojada podemos visualizar los tipos de datos:
(se recomienda comprender los fundamentos de la programaci贸n)
int: Enteros. N煤meros 鈥渞edondos鈥 como 1, 2, 3, 10, 100.
num: Num茅rico. N煤meros flotantes (o de coma flotante, decimales), como 1.5, 2.3, 3.2, 0.01.
logi: Booleanos. Valores de true o false

Vale la pena aclarar que en los datasets, los valores booleanos pueden estar representados con los enteros (int) 1 y 0, true o false respectivamente.
Para cambiar el tipo de dato, podemos llamar al dataset, situarnos en la variable, y utilizar el m茅todo as.logical().
dataset$var = as.logical(dataset$var)

Tambi茅n vimos la variable Factor, se usa para clasificar los datos seg煤n su grupo o categor铆a.

Hubo dos t茅rminos claves, observaciones y variables.
Observaciones: Filas.
Variables: Columnas.
Donde fila y columna tienen el mismo significado que tienen en una tabla convencional; fila y observaci贸n son sin贸nimos, y variables y columnas tambi茅n.

Otra forma de ver la descripci贸n del dataset es en el panel derecho en la secci贸n que dice Environment seleccionamos el dataset que importamos y desplegamos su informaci贸n:

Y para quienes les sali贸 18 observaciones de 13 variables, es porque al importar quitan los headings por eso es que les sale una observaci贸n de m谩s, para evitar esto habiliatamos la opci贸n.

Saludos

para poder cargar el dataset 鈥渕tcars.csv鈥:

mtcars <- read.csv("mtcars.csv", header=TRUE)
  • header: si el archivo 鈥渕tcars.csv鈥 tiene el nombre de las columnas en la primera linea.

Es cargar directamente desde el link de github el dataset _orangee.csv _utilizando el comando _read.csv _(con read.table tambi茅n es posible).

El ejemplo con read.table() ser铆a:

orangeec <- read.table("https://raw.githubusercontent.com/sap0408/Orange-Economy/master/orangeec.csv", header =  TRUE, sep = ",")

Mi an谩lisis del data set de la econom铆a naranja.
1.- Tiene 17 obs de 13 variables.
2.- La variable Contry es cualitativa y son las obs.
3.- Dentro de las 13 variables solo GDP.PC (El PIB per capita) es de tipo entero (int) y el resto son de tipo num con coma flotante.
4.- No existe variables de tipo logical (booleanos)
5.- La variable Creat Ind % GDP (El aporte de las industrias creativas) presenta datos vac铆os o restantes. (N/A)

17 Observaciones (Filas)
13 Variables (Columnas)

1 Columna Categorica
1 Columna Numero Entero
15 Columnas Numero Natural

Tengo una pequenda duda: Por que la variable de trasmision es 0 y 1 se convierte a True o Flase? A mi parecer, eso no escalaria, supongamos que el dia de manana se inventa un tramision tipo 鈥渟mart鈥. Otra duda, en R existen las claves foraneas o todos son tipos duros?

17 Observaciones
13 Variables (12 variables datos n煤meros, 1 variable entero)

cuando se importa el dataset orangeec, todas las variables aparecen tipo factor, esto ocurre ya que cuando se importa el dataset se debe colocar yes en la seccion que dice heading, o sino los coloca todos como tipo fact,
esto esta mejor explicado en la documentaci贸n

por lo tanto:

orangeec 17 obj y 13 variables
de las cuales 11 son tipo num, 1 int, 1 factor

Si est谩n en Windows para cargar el dataset el c贸digo ser铆 as铆:

mtcars <- read.csv("c:\ruta\\de\\mi\\archivo\\mtcars.csv")

En mi versi贸n ya no aparece como factor ahora dice chr, supongo que significa char o caracter.

Para conocer el tipo de datos del dataset tenemos dos formas de hacerlo:

  1. con la opci贸n str(nombre_dataset) en el R Script y el resultado sale en console
  2. En Enviroment oprimimos la flecha hacia abajo del dataset

Para responder la pregunta el dataset orangeec tiene 17 observaciones y 13 variables

Tambi茅n podemos cargarlo con la siguiente instrucci贸n en R:

mtcars <- read.csv("https://raw.githubusercontent.com/sap0408/mtcars/master/mtcars.csv", sep = ',')

Teniendo en cuenta al utilizar como fuente de los datos una direcci贸n URL, corremos el riesgo que esta pueda cambiar y si en un futuro ejecutamos de nuevo esta instrucci贸n podemos tener un error. Por tanto creo importante tener tanto esta instrucci贸n como opci贸n pero tambi茅n tener el archivo descargado.

Estar seguro de la estructura de datos para saber como trabajar con ellos, como transformarlo y que tipo de operaciones podemos hacer.

鈥榙ata.frame鈥: 17 obs. of 13 variables 馃槃

yo sigo sin poder ver el archivo de orangeec, le tengo metido en la misma carpeta donde guardo los scripts de R Studio y nada, siempre me detecta uno que se llama Orange, que no es este. En cambio este 煤ltimo archivo, el mtcars, lo veo perfectamente, si que me lo detecta el programa de R Studio

17 observaciones y 13 variables

para orangeec ser铆an 18 obs y 13 vars
Que pr谩ctica herramienta y muy interesante!

Esta docente explica muy bien, desde lo mas m铆nimo y eso es excelente

Para saber la el numero de observaciones y el numero de variables del dataset orangeec se implementa la funcion **STR **para mostrarnos la estructura:

Me salen 18 observaciones y 13 variables. Al ver los comentarios noto que a los dem谩s les sale 17 observaciones, es decir, el m铆o est谩 tomando el encabezado de la tabla como una observaci贸n, 驴Alguien sabe por qu茅 sucede esto ?

Ya me aparecen 17 registros, 13 variables, la primera variabes, las segunda entera y demas numericas
buenas tardes, no se porque todas las variables dew orangeec me las genera tipo caracter
Todas son tipo caracter
orangeec tiene 18 registros y 13 variables

Comentario:
aplique los codigo correspondiente: str(orangeec)
?Orange
class(orangeec$vs)
orangeec$v7 = as.logical(orangeec$v1)
orangeec$v1 = as.logical(orangeec$v8.
Luego el resultado de la data de ECONOMIA NARANJA. Salio el siguiente resultado:
str(orangeec)
?Orange
class(orangeec$vs)
orangeec$v7 = as.logical(orangeec$v1)
orangeec$v1 = as.logical(orangeec$v8

str(orangeec)
鈥榙ata.frame鈥: 17 obs. of 13 variables:

Hola, este es n煤mero de observaciones y variables en el dataset de econom铆a naranja, visualiz谩ndolo con el comando str

32 observaciones y 12 variables

17 observaciones y 13 variables

13 variables y 17 observaciones en el dataset de orange economy

str(orangeec)
spc_tbl_ [17 x 13] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
$ Country : chr [1:17] 鈥淎rgentina鈥 鈥淏elize鈥 鈥淏olivia鈥 鈥淏razil鈥 鈥
$ GDP PC : num [1:17] 20900 8300 7500 15600 24500 14500 16900 11500 8900 8100 鈥
$ GDP US bill : num [1:17] 6.38e+02 1.85e+03 3.71e+01 2.06e+06 2.77e+02 鈥
$ GDP Growth % : num [1:17] 2.9 0.8 4.2 1 1.5 1.8 3.2 2.7 2.4 2.8 鈥
$ Services % GDP : num [1:17] 60.9 62.2 50 72.8 64.3 61.4 73.5 56.9 64.9 63.2 鈥
$ Creat Ind % GDP : num [1:17] 3.8 NA NA 2.6 2.2 3.3 2 2 NA NA 鈥
$ Inflation : num [1:17] 25.7 1.1 2.8 3.4 2.2 4.3 1.6 0.4 1 4.4 鈥
$ Unemployment : num [1:17] 8.1 10.1 4 11.8 7 10.5 8.1 4.6 7 2.3 鈥
$ % pop below poverty line : num [1:17] 25.7 41 38.6 4.2 14.4 28 21.7 21.5 32.7 59.3 鈥
$ Internet penetration % population: num [1:17] 93.1 52.3 78.6 70.7 77.5 63.2 86.7 79.9 57.7 42.1 鈥
$ Median age : num [1:17] 31.7 22.7 24.3 32 34.4 30 31.3 27.7 27.1 22.1 鈥
$ % pop 25-54 : num [1:17] 39.4 36.6 37.5 43.9 43.1 鈥
$ Education invest % GDP : num [1:17] 5.9 7.4 7.3 5.9 4.9 4.5 7.1 5 3.5 2.8 鈥

  • attr(*, 鈥渟pec鈥)=
    鈥 cols(
    鈥 Country = col_character(),
    GDP PC = col_double(),
    GDP US bill = col_double(),
    GDP Growth % = col_double(),
    Services % GDP = col_double(),
    Creat Ind % GDP = col_double(),
    鈥 Inflation = col_double(),
    鈥 Unemployment = col_double(),
    % pop below poverty line = col_double(),
    Internet penetration % population = col_double(),
    Median age = col_double(),
    % pop 25-54 = col_double(),
    Education invest % GDP = col_double()
    鈥 )
  • attr(*, 鈥減roblems鈥)=<externalptr>

El dataset de orangeec tiene 17 observaciones (filas) y 13 variables (columnas).

str(orangeec)
鈥榙ata.frame鈥: 18 obs. of 13 variables:
$ V1 : chr 鈥淐ountry鈥 鈥淎rgentina鈥 鈥淏elize鈥 鈥淏olivia鈥 鈥
$ V2 : chr 鈥淕DP PC鈥 鈥20900鈥 鈥8300鈥 鈥7500鈥 鈥
$ V3 : chr 鈥淕DP US bill鈥 鈥637.7鈥 鈥1854鈥 鈥37.1鈥 鈥
$ V4 : chr 鈥淕DP Growth %鈥 鈥2.9鈥 鈥0.8鈥 鈥4.2鈥 鈥
$ V5 : chr 鈥淪ervices % GDP鈥 鈥60.9鈥 鈥62.2鈥 鈥50鈥 鈥
$ V6 : chr 鈥淐reat Ind % GDP鈥 鈥3.8鈥 鈥溾 鈥溾 鈥
$ V7 : chr 鈥淚nflation鈥 鈥25.7鈥 鈥1.1鈥 鈥2.8鈥 鈥
$ V8 : chr 鈥淯nemployment鈥 鈥8.1鈥 鈥10.1鈥 鈥4鈥 鈥
$ V9 : chr 鈥% pop below poverty line鈥 鈥25.7鈥 鈥41鈥 鈥38.6鈥 鈥
$ V10: chr 鈥淚nternet penetration % population鈥 鈥93.1鈥 鈥52.3鈥 鈥78.6鈥 鈥
$ V11: chr 鈥淢edian age鈥 鈥31.7鈥 鈥22.7鈥 鈥24.3鈥 鈥
$ V12: chr 鈥% pop 25-54鈥 鈥39.38鈥 鈥36.62鈥 鈥37.48鈥 鈥
$ V13: chr 鈥淓ducation invest % GDP鈥 鈥5.9鈥 鈥7.4鈥 鈥7.3鈥 鈥

Datos de la columna que hace referencia a la media de la edad:

orange$V11
[1] "Median age" "31.7"       "22.7"       "24.3"       "32"         "34.4"       "30"        
 [8] "31.3"       "27.7"       "27.1"       "22.1"       "23"         "28.3"       "25.7"      
[15] "29.2"       "28.2"       "28"         "35"  

Esto es lo que me arroja la funci贸n str:

> str(orange)
'data.frame':	18 obs. of  13 variables:
 $ V1 : chr  "Country" "Argentina" "Belize" "Bolivia" ...
 $ V2 : chr  "GDP PC" "20900" "8300" "7500" ...
 $ V3 : chr  "GDP US bill" "637.7" "1854" "37.1" ...
 $ V4 : chr  "GDP Growth %" "2.9" "0.8" "4.2" ...
 $ V5 : chr  "Services % GDP" "60.9" "62.2" "50" ...
 $ V6 : chr  "Creat Ind % GDP" "3.8" "" "" ...
 $ V7 : chr  "Inflation" "25.7" "1.1" "2.8" ...
 $ V8 : chr  "Unemployment" "8.1" "10.1" "4" ...
 $ V9 : chr  "% pop below poverty line" "25.7" "41" "38.6" ...
 $ V10: chr  "Internet penetration % population" "93.1" "52.3" "78.6" ...
 $ V11: chr  "Median age" "31.7" "22.7" "24.3" ...
 $ V12: chr  "% pop 25-54" "39.38" "36.62" "37.48" ...
 $ V13: chr  "Education invest % GDP" "5.9" "7.4" "7.3" ...

Ejecut茅 este comando > ?orangeec
y me gener贸 esta advertencia:
No documentation for 鈥榦rangeec鈥 in specified packages and libraries:
you could try 鈥??orangeec鈥

驴C贸mo se crea una documentaci贸n general del paquete orangeec ?,

Hola.
El dataset orangeec.csv tiene 17 observaciones y 13 variables. Entre ellas hay una tipo chr, una tipo int y 11 tipo num (tengo la versi贸n R.4.2.3)

Con la versi贸n que estoy usando no aparece la misma redacci贸n, pero se entiende de la misma manera:

<spc_tbl_ [1713] (S3: spec_tbl_df/tbl_df/tbl/data. Frame)> 

De esta manera el primer n煤mero de los br谩quets son las 17 observaciones y el segundo son las 13 variables.

Diplacement: Cilindraje. Los estadounidenses lo miden en pulgadas c煤bicas. Nosotros en Colombia lo medimos en Cent铆metros c煤bicos y es una variable important铆sima inclusive para el pago del SOAT. Ejemplo, veh铆culos con motor con cilindraje menor al 1400 cc pagan menos

De acuerdo a Rstudio, me salen 17 observaciones y 13 variables. Una variable es de tipo factor (aparece CHR, pero asumo que es factor), una variable que es de tipo integer y las 11 restantes de tipo num茅rico.

La primera ver que ejecute el c贸digo para ver la estructura del dataset orangeec en el fichero script R
str(orangeec)
el resultado en la consola fue que todos las variables eran de tip o chr, esto era debido a que al importar el dataset no hab铆a indicado que los datos ten铆an cabecera (heading)
鈥榙ata.frame鈥: 18 obs. of 13 variables:
$ V1 : chr 鈥淐ountry鈥 鈥淎rgentina鈥 鈥淏elize鈥 鈥淏olivia鈥 鈥
$ V2 : chr 鈥淕DP PC鈥 鈥20900鈥 鈥8300鈥 鈥7500鈥 鈥
$ V3 : chr 鈥淕DP US bill鈥 鈥637.7鈥 鈥1854鈥 鈥37.1鈥 鈥
$ V4 : chr 鈥淕DP Growth %鈥 鈥2.9鈥 鈥0.8鈥 鈥4.2鈥 鈥
$ V5 : chr 鈥淪ervices % GDP鈥 鈥60.9鈥 鈥62.2鈥 鈥50鈥 鈥
$ V6 : chr 鈥淐reat Ind % GDP鈥 鈥3.8鈥 鈥溾 鈥溾 鈥
$ V7 : chr 鈥淚nflation鈥 鈥25.7鈥 鈥1.1鈥 鈥2.8鈥 鈥
$ V8 : chr 鈥淯nemployment鈥 鈥8.1鈥 鈥10.1鈥 鈥4鈥 鈥
$ V9 : chr 鈥% pop below poverty line鈥 鈥25.7鈥 鈥41鈥 鈥38.6鈥 鈥
$ V10: chr 鈥淚nternet penetration % population鈥 鈥93.1鈥 鈥52.3鈥 鈥78.6鈥 鈥
$ V11: chr 鈥淢edian age鈥 鈥31.7鈥 鈥22.7鈥 鈥24.3鈥 鈥
$ V12: chr 鈥% pop 25-54鈥 鈥39.38鈥 鈥36.62鈥 鈥37.48鈥 鈥
$ V13: chr 鈥淓ducation invest % GDP鈥 鈥5.9鈥 鈥7.4鈥 鈥7.3鈥 鈥

Lo solucione volviendo a importar el dataset e indicando que hab铆a cabecera.

str(orangeec)
鈥榙ata.frame鈥: 17 obs. of 13 variables:
$ Country : chr 鈥淎rgentina鈥 鈥淏elize鈥 鈥淏olivia鈥 鈥淏razil鈥 鈥
$ GDP.PC : int 20900 8300 7500 15600 24500 14500 16900 11500 8900 8100 鈥
$ GDP.US.bill : num 6.38e+02 1.85e+03 3.71e+01 2.06e+06 2.77e+02 鈥
$ GDP.Growth鈥 : num 2.9 0.8 4.2 1 1.5 1.8 3.2 2.7 2.4 2.8 鈥
$ Services鈥DP : num 60.9 62.2 50 72.8 64.3 61.4 73.5 56.9 64.9 63.2 鈥
$ Creat.Ind鈥DP : num 3.8 NA NA 2.6 2.2 3.3 2 2 NA NA 鈥
$ Inflation : num 25.7 1.1 2.8 3.4 2.2 4.3 1.6 0.4 1 4.4 鈥
$ Unemployment : num 8.1 10.1 4 11.8 7 10.5 8.1 4.6 7 2.3 鈥
$ X鈥op.below.poverty.line : num 25.7 41 38.6 4.2 14.4 28 21.7 21.5 32.7 59.3 鈥
$ Internet.penetration鈥opulation: num 93.1 52.3 78.6 70.7 77.5 63.2 86.7 79.9 57.7 42.1 鈥
$ Median.age : num 31.7 22.7 24.3 32 34.4 30 31.3 27.7 27.1 22.1 鈥
$ X鈥op.25.54 : num 39.4 36.6 37.5 43.9 43.1 鈥
$ Education.invest鈥DP : num 5.9 7.4 7.3 5.9 4.9 4.5 7.1 5 3.5 2.8 鈥

Prob茅 a ver si hab铆a informaci贸n del dataset en la ayuda

?orangeec
No documentation for 鈥榦rangeec鈥 in specified packages and libraries:

Tambi茅n descubr铆 que en la pesta帽a environment desplegando en el dataset orangeec pod铆as ver el tipo de datos

Utilizando la siguiente expresion: str(orangeec), obtuve que hay 17 observaciones cada uno con 13 variables.

Un total de 17 observaciones o registros y 13 variables conforman la data de orangeec, suministrando la informaci贸n de 13 pa铆ses latinoamericanos.

reto:
de la base orangeec se encuentran:

str(orangeec)
鈥榙ata.frame鈥: 18 obs(registros). de 13 variables (columnas)

17 observaciones y 13 variables

La data orangeec tiene 18 observaciones y 13 variables

El resultado es 17 observaciones y 13 variables, con respecto al tipo de variables se encontraron ( 1 (chr), 1 (Int) y 11 (num), adjunto visualizaci贸n.

17 obs. of 13 variables:

En el dataset orangeec obtuve lo siguiente:
鈥榙ata.frame鈥: 18 obs. of 13 variables:
$ V1 : chr 鈥淐ountry鈥 鈥淎rgentina鈥 鈥淏elize鈥 鈥淏olivia鈥 鈥
$ V2 : chr 鈥淕DP PC鈥 鈥20900鈥 鈥8300鈥 鈥7500鈥 鈥
$ V3 : chr 鈥淕DP US bill鈥 鈥637.7鈥 鈥1854鈥 鈥37.1鈥 鈥
$ V4 : chr 鈥淕DP Growth %鈥 鈥2.9鈥 鈥0.8鈥 鈥4.2鈥 鈥
$ V5 : chr 鈥淪ervices % GDP鈥 鈥60.9鈥 鈥62.2鈥 鈥50鈥 鈥
$ V6 : chr 鈥淐reat Ind % GDP鈥 鈥3.8鈥 鈥溾 鈥溾 鈥
$ V7 : chr 鈥淚nflation鈥 鈥25.7鈥 鈥1.1鈥 鈥2.8鈥 鈥
$ V8 : chr 鈥淯nemployment鈥 鈥8.1鈥 鈥10.1鈥 鈥4鈥 鈥
$ V9 : chr 鈥% pop below poverty line鈥 鈥25.7鈥 鈥41鈥 鈥38.6鈥 鈥
$ V10: chr 鈥淚nternet penetration % population鈥 鈥93.1鈥 鈥52.3鈥 鈥78.6鈥 鈥
$ V11: chr 鈥淢edian age鈥 鈥31.7鈥 鈥22.7鈥 鈥24.3鈥 鈥
$ V12: chr 鈥% pop 25-54鈥 鈥39.38鈥 鈥36.62鈥 鈥37.48鈥 鈥
$ V13: chr 鈥淓ducation invest % GDP鈥 鈥5.9鈥 鈥7.4鈥 鈥7.3鈥 鈥

No existe la documentaci贸n para nuestro Data Set orangeec,
con el comando ?orangeec

17 obs. of 13 variables

Buenas noches

Para esta actividad me sale 17 observaciones y 13 variables los cuales son :

$ Country : chr 鈥淎rgentina鈥 鈥淏elize鈥 鈥淏olivia鈥 鈥淏razil鈥 鈥
$ GDP.PC : int 20900 8300 7500 15600 24500 14500 16900 11500 8900 8100 鈥
$ GDP.US.bill : num 6.38e+02 1.85e+03 3.71e+01 2.06e+06 2.77e+02 鈥
$ GDP.Growth鈥 : num 2.9 0.8 4.2 1 1.5 1.8 3.2 2.7 2.4 2.8 鈥
$ Services鈥DP : num 60.9 62.2 50 72.8 64.3 61.4 73.5 56.9 64.9 63.2 鈥
$ Creat.Ind鈥DP : num 3.8 NA NA 2.6 2.2 3.3 2 2 NA NA 鈥
$ Inflation : num 25.7 1.1 2.8 3.4 2.2 4.3 1.6 0.4 1 4.4 鈥
$ Unemployment : num 8.1 10.1 4 11.8 7 10.5 8.1 4.6 7 2.3 鈥
$ X鈥op.below.poverty.line : num 25.7 41 38.6 4.2 14.4 28 21.7 21.5 32.7 59.3 鈥
$ Internet.penetration鈥opulation: num 93.1 52.3 78.6 70.7 77.5 63.2 86.7 79.9 57.7 42.1 鈥
$ Median.age : num 31.7 22.7 24.3 32 34.4 30 31.3 27.7 27.1 22.1 鈥
$ X鈥op.25.54 : num 39.4 36.6 37.5 43.9 43.1 鈥
$ Education.invest鈥DP : num 5.9 7.4 7.3 5.9 4.9 4.5 7.1 5 3.5 2.8 鈥

Al buscar mas informaci贸n en la pesta帽a de Help me sale error.

?orangeec
No documentation for 鈥榦rangeec鈥 in specified packages and libraries:
you could try 鈥??orangeec鈥

Hola! el dataset orangeec cuenta con 17 observaciones y 13 variables
str(orangeec)
data.frame鈥: 17 obs. of 13 variables:

17 observaciones y 13 variables

str(orangeec)
鈥榙ata.frame鈥: 18 obs. of 13 variables:
$ V1 : chr 鈥淐ountry鈥 鈥淎rgentina鈥 鈥淏elize鈥 鈥淏olivia鈥 鈥
$ V2 : chr 鈥淕DP PC鈥 鈥20900鈥 鈥8300鈥 鈥7500鈥 鈥
$ V3 : chr 鈥淕DP US bill鈥 鈥637.7鈥 鈥1854鈥 鈥37.1鈥 鈥
$ V4 : chr 鈥淕DP Growth %鈥 鈥2.9鈥 鈥0.8鈥 鈥4.2鈥 鈥
$ V5 : chr 鈥淪ervices % GDP鈥 鈥60.9鈥 鈥62.2鈥 鈥50鈥 鈥
$ V6 : chr 鈥淐reat Ind % GDP鈥 鈥3.8鈥 鈥溾 鈥溾 鈥
$ V7 : chr 鈥淚nflation鈥 鈥25.7鈥 鈥1.1鈥 鈥2.8鈥 鈥
$ V8 : chr 鈥淯nemployment鈥 鈥8.1鈥 鈥10.1鈥 鈥4鈥 鈥
$ V9 : chr 鈥% pop below poverty line鈥 鈥25.7鈥 鈥41鈥 鈥38.6鈥 鈥
$ V10: chr 鈥淚nternet penetration % population鈥 鈥93.1鈥 鈥52.3鈥 鈥78.6鈥 鈥
$ V11: chr 鈥淢edian age鈥 鈥31.7鈥 鈥22.7鈥 鈥24.3鈥 鈥
$ V12: chr 鈥% pop 25-54鈥 鈥39.38鈥 鈥36.62鈥 鈥37.48鈥 鈥
$ V13: chr 鈥淓ducation invest % GDP鈥 鈥5.9鈥 鈥7.4鈥 鈥7.3鈥 鈥

?orangeec
No documentation for 鈥榦rangeec鈥 in specified packages and libraries:
you could try 鈥??orangeec鈥

EL modelo aparece como 鈥渃hr鈥 que indica caracateres o cadenas no un factor

Al poder ver la estructura de los datos de la base de econom铆a naranja (orangeec) se encontr贸:
17 obs. of 13 variables en donde de las 13 variables: 1 es entera, 1 es caracter y las restantes son n煤mericas.

Hola, cantidad de observaciones 17 y 13 variables:
Country: caracter
GDP.PC: entero
GDP.US.bill; GDP.Growth; Services鈥DP; Creat.Ind鈥DP; Inflation; Unemployment; X鈥op.below.poverty.line; Internet.penetration鈥opulation; Median.age; X鈥op.25.54 y Education.invest鈥DP: num茅rico

En la clase, la profesora tiene los datos como paquete. Por eso ademas de los datos parece que tiene un archivo con etiquetas. No ense帽a como crear ese archivo de texto, eso es para crear paquetes, pero se supone que esas etiquetas no son importantes para los calculos.

Se importo y exploro 鈥渙rangeec.cvs鈥:

$ Country : chr 鈥淎rgentina鈥 鈥淏elize鈥 鈥淏olivia鈥 鈥淏razil鈥 鈥
$ GDP.PC : int 20900 8300 7500 15600 24500 14500 16900 11500 8900 8100 鈥
$ GDP.US.bill : num 6.38e+02 1.85e+03 3.71e+01 2.06e+06 2.77e+02 鈥
$ GDP.Growth鈥 : num 2.9 0.8 4.2 1 1.5 1.8 3.2 2.7 2.4 2.8 鈥
$ Services鈥DP : num 60.9 62.2 50 72.8 64.3 61.4 73.5 56.9 64.9 63.2 鈥
$ Creat.Ind鈥DP : num 3.8 NA NA 2.6 2.2 3.3 2 2 NA NA 鈥
$ Inflation : num 25.7 1.1 2.8 3.4 2.2 4.3 1.6 0.4 1 4.4 鈥
$ Unemployment : num 8.1 10.1 4 11.8 7 10.5 8.1 4.6 7 2.3 鈥
$ X鈥op.below.poverty.line : num 25.7 41 38.6 4.2 14.4 28 21.7 21.5 32.7 59.3 鈥
$ Internet.penetration鈥opulation: num 93.1 52.3 78.6 70.7 77.5 63.2 86.7 79.9 57.7 42.1 鈥
$ Median.age : num 31.7 22.7 24.3 32 34.4 30 31.3 27.7 27.1 22.1 鈥
$ X鈥op.25.54 : num 39.4 36.6 37.5 43.9 43.1 鈥
$ Education.invest鈥DP : num 5.9 7.4 7.3 5.9 4.9 4.5 7.1 5 3.5 2.8 鈥

17 obs. y 13 variables

Reto:

17 observaciones y 13 variales

Convertir variable num茅rica en l贸gica (boleana o dicot贸mica).

Reto:
Son 17 obs o filas y 13 variables o columnas.

18 observaciones y 13 variables. 馃槂

str(orangeec)
鈥榙ata.frame鈥: 17 obs. of 13 variables:
$ Country : chr 鈥淎rgentina鈥 鈥淏elize鈥 鈥淏olivia鈥 鈥淏razil鈥 鈥
$ GDP.PC : int 20900 8300 7500 15600 24500 14500 16900 11500 8900 8100 鈥
$ GDP.US.bill : num 6.38e+02 1.85e+03 3.71e+01 2.06e+06 2.77e+02 鈥
$ GDP.Growth鈥 : num 2.9 0.8 4.2 1 1.5 1.8 3.2 2.7 2.4 2.8 鈥
$ Services鈥DP : num 60.9 62.2 50 72.8 64.3 61.4 73.5 56.9 64.9 63.2 鈥
$ Creat.Ind鈥DP : num 3.8 NA NA 2.6 2.2 3.3 2 2 NA NA 鈥
$ Inflation : num 25.7 1.1 2.8 3.4 2.2 4.3 1.6 0.4 1 4.4 鈥
$ Unemployment : num 8.1 10.1 4 11.8 7 10.5 8.1 4.6 7 2.3 鈥
$ X鈥op.below.poverty.line : num 25.7 41 38.6 4.2 14.4 28 21.7 21.5 32.7 59.3 鈥
$ Internet.penetration鈥opulation: num 93.1 52.3 78.6 70.7 77.5 63.2 86.7 79.9 57.7 42.1 鈥
$ Median.age : num 31.7 22.7 24.3 32 34.4 30 31.3 27.7 27.1 22.1 鈥
$ X鈥op.25.54 : num 39.4 36.6 37.5 43.9 43.1 鈥
$ Education.invest鈥DP

32 observaciones de 12 variables.

orangeec = 18 obs y 13 variables

32 obs y 12 variables

Data set compuesto por 17 observaciones y 13 variables

17 obs y 13 variables en country en esta version mas reciente me sale chr que significa 鈥渧ectores de caracteres o cadenas鈥

str(orangeec)

32 obs y 11 variables

17 observaciones y 13 variables para orangeec

Me sale 18 observaciones, pero como mencionan, es el header. As铆 que 17 y 13 variables.

El set Orangeec tiene 17 observaciones y 13 variables (:

En mi caso yo tengo:
17 Observaciones
13 Variables
1 variable con valores de tipo Chr
1 variable con valores de tipo Int
11 variable con valores de tipo Num

18 observaciones y variables

17 observaciones con 13 variables

En el data frame de Orangeec: obtengo 18 observaciones y 13 variables.
$ V1 : chr 鈥淐ountry鈥 鈥淎rgentina鈥 鈥淏elize鈥 鈥淏olivia鈥 鈥
$ V2 : chr 鈥淕DP PC鈥 鈥20900鈥 鈥8300鈥 鈥7500鈥 鈥
$ V3 : chr 鈥淕DP US bill鈥 鈥637.7鈥 鈥1854鈥 鈥37.1鈥 鈥
$ V4 : chr 鈥淕DP Growth %鈥 鈥2.9鈥 鈥0.8鈥 鈥4.2鈥 鈥
$ V5 : chr 鈥淪ervices % GDP鈥 鈥60.9鈥 鈥62.2鈥 鈥50鈥 鈥
$ V6 : chr 鈥淐reat Ind % GDP鈥 鈥3.8鈥 鈥溾 鈥溾 鈥
$ V7 : chr 鈥淚nflation鈥 鈥25.7鈥 鈥1.1鈥 鈥2.8鈥 鈥
$ V8 : chr 鈥淯nemployment鈥 鈥8.1鈥 鈥10.1鈥 鈥4鈥 鈥
$ V9 : chr 鈥% pop below poverty line鈥 鈥25.7鈥 鈥41鈥 鈥38.6鈥 鈥
$ V10: chr 鈥淚nternet penetration % population鈥 鈥93.1鈥 鈥52.3鈥 鈥78.6鈥 鈥
$ V11: chr 鈥淢edian age鈥 鈥31.7鈥 鈥22.7鈥 鈥24.3鈥 鈥
$ V12: chr 鈥% pop 25-54鈥 鈥39.38鈥 鈥36.62鈥 鈥37.48鈥 鈥
$ V13: chr 鈥淓ducation invest % GDP鈥 鈥5.9鈥 鈥7.4鈥 鈥7.3鈥 鈥

Las variables que solo pueden tomar dos valores se conocen como dicot贸micas o dummys.

鈥榙ata.frame鈥: 18 obs. of 13 variables:

32 obs. of 12 variables

Por si no lo notaron en la estructura del Data set tiene que ser 32 observaciones y 12 variables, si les sale diferente tienen que arreglar en la parte de Importar datos, cambiar en la opci贸n de Header.

El Dataset orangeec tiene 17 obs y 13 variables. Sin embargo, algunas de las variables como el desempleo o el crecimiento del PIB deben ser expresadas en t茅rminos porcentuales, por lo tanto, hay que transformar la estructura de las variables.

Orangeec contiene 17 obs y 13 variables.

Variables.
1 chr.
1 int.
11 num.

鈥榙ata.frame鈥:18 obs. of 13 variables 馃槂

En el dataset: orangeec hay 17 observaciones y 13 variables. Hay variables n煤mericas y enteras.

17 obs. of 13 variables.
Num茅ricos.
脥ntegros.
Caracter.

tambien lo probe con el as.logical

17 observaciones y 13 variables.

鈥 Country = col_character(),
GDP PC = col_double(),
GDP US bill = col_double(),
GDP Growth % = col_double(),
Services % GDP = col_double(),
Creat Ind % GDP = col_double(),
鈥 Inflation = col_double(),
鈥 Unemployment = col_double(),
% pop below poverty line = col_double(),
Internet penetration % population = col_double(),
Median age = col_double(),
% pop 25-54 = col_double(),
Education invest % GDP = col_double()

dataset:Economia naranja contiene 17 observaciones y 13 variables

Siento que a este curso de fundamentos no tiene nada.
La docente va demasiado r谩pido en cosas que son elementales y en cosas triviales pierde mucho tiempo. Adem谩s no muestra el proceso completo de como hace algunos pasos y tampoco contesta las preguntas que dejan los estudiantes,
Mejor me voy a hacer otro curso.