Cada clase me gusta mas, gracias profe
Bienvenida e introducción
Todo lo que aprenderás sobre el lenguaje R
Programación y Data Science
R y proyecto economía naranja.
Instalando nuestras herramientas
Variables, tipos de datos y estructuras
Los primeros cálculos con R y variables
Tipos de datos
Estructura del dataset del proyecto
Vectores
Matrices
Ejercicios con matrices
Operadores para comparar y ubicar datos
Factores, listas y echar un vistazo al dataset
EDA: Exploratory data analysis
Qué es EDA: Exploratory Data Analysis
Gráficas de dispersión e histogramas.
Box Plot y su interpretación
EDA con dataset proyecto - Gráficas de dispersión.
EDA con histogramas.
EDA con dataset proyecto - histogramas - ggplot2
EDA con box plot- ggplot2
EDA con dataset proyecto - box plot- ggplot2 - dplyr
EDA con gráficas de dispersión con más de dos variables - ggplot2
EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly
La estadística de los datos
Buscando correlaciones con pairs
Confirmando correlaciones con la función cor
Buscando correlaciones con pairs en dataset proyecto
Confirmando correlaciones con la función cor en dataset proyecto.
Protegiéndonos de los peligros del promedio.
Eliminando los NA's para hacer los cálculos.
Estadística y visualización aplicada a análisis de datos de mercadeo.
Ajustando los datos
Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1
Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2
Mejorando la visualización
Viendo más información con facet wrap - Parte 1
Viendo más información con facet wrap - Parte 2
Organizar visualizaciones y código con R Markdown
Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.
Conclusiones Finales
Invitación a continuar recorriendo el mundo del data science.
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
Sonia Ardila
Aportes 21
Preguntas 5
Cada clase me gusta mas, gracias profe
Tomar en cuenta que en el video, al decir que “no es negativa” (el valor de -0.4412) se refiere a que no se considera que haya correlacion, ya que se descartan las correlaciones que estan mas cercanas al cero que al 1 o -1.
Por lo tanto, se considera que hay correlacion cuando el valor es menor que -0.5 o mayor que 0.5
Clase 26 🙂
Confirmando correlaciones con la función cor en dataset proyecto
.
.
Con cor confirmo si la aparente correlacion vista en la grafica de dispersion
existe o no existe
.
cor(dataset[,])
.
.
Los NA no sirven
Se necesitan numeros frente a numeros para tener la correlacion
Para eliminar los NA
.
cor(dataset[,], use=“complete.obs”)
Es muy interesante la facilidad que tiene R, para tratar con los datos, por ejemplo el cálculo de de la correlación ignorando los NA, solo con un comando
pairs(orangeec[,5:10])
cor(orangeec[,2:6],use = "complete.obs")
Pienso que igual si la correlación pasa de 0.2… se entiende que hay valores que influyen en que sea positiva, mientras que los resultados que si aparecieran en negativo directamente están siento descartables
Pues me quedo la duda cuando menciono que el crecimiento era del 0.3 pudiese descartarse pero aun así muestra rasgos significativos resaltables
Para que haya correlación de variables los datos deben estar comprendidos entre 1 y -1 cuando hay un valor como por ejemplo el -04412121 como esta mas cerca del 0 entonces no existe correlación.
al principio fue un poco avanzado, pero cada clase esta mejor que la anterior
En mi opinión lo que se explica en el vídeo puede que este en parte mal explicado, ya que ella afirma que si la correlación es menor a 0.5 o a -0.5 no existe, siendo esta una afirmación falsa, ya que la correlación si existe, ya que de 0 a 0.33 o en su defecto a -0.33, es una correlación baja, de 0.33 a 0.66, es una correlación media, y de 0.66 a 1 es alta.
Algo a tomar en cuenta para próximas revisiones de vídeos.
a partir de que valor se puede decir que una correlacion es negativa, positiva o neutro (si existe)?
Me sale el siguiente erro, alguna idea de qué falla?
cor(orangeec[,2:6],use="complete.obs")
Error in cor(orangeec[, 2:6], use = "complete.obs") : 'x' must be numeric
Por que la relacion de desempleo y aporte de la economia naranja ( -0.41885405) se dice que no es negativo??? si tiene un menos ( - ) y no este por encima de 0.5… al igual que 0.025…
## Confirmando correlaciones con la función cor en dataset proyecto.
cor(orangeec[,2:6])
#solucionando n/a
cor(orangeec[,2:6],use="complete.obs")
cor(orangeec[,5:10],use="complete.obs")
cor(newdata,use="complete.obs")```
Quitar NA
.
.
¡Interpreta correctamente la informaciòn que ves en r para que puedas comunicar lo observado. el objetivo es que logremos usar el programa con agilidad y asi hacer un analisis mas rapido!
Cuando la cor() es inferior a 0.5 es negativa; esta mas cerca del 0 no hay correlacion entre las variables analizadas
La relacion entre el Aporte de los Servicios al PIB del pais (Service...GDP) y el PIB per capita en cada pais (GDP.PC) es positiva con un 0.64 de correlacion. Es decir los paises que han tenido MAS aporte al PIB desde sus Servicios tienen un PIB per capita MAYOR
cor(orangeec[,2:6],use="complete.obs")
cor(orangeec[,5:10],use="complete.obs")
cor(newdata,use="complete.obs")
#Confirmando correlaciones con la funcion COR
cor(orangeec[,2:6]) #Si salen NA no nos sirven esos datos
#en esta linea ponemos solo las obsevaciones que esten completas
cor(orangeec[,2:6], use = "complete.obs")
cor(orangeec[,5:10], use = "complete.obs")
cor(newdata, use="complete.obs")
cor(orangeec[,2:6])
#solucionar NA
cor(orangeec[,2:6], use="complete.obs")
cor(orangeec[,5:10], use="complete.obs")
cor(newdata, use="complete.obs")
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?