Les comparto mis notas sobre este curso, espero les sean de utilidad
https://github.com/rb-one/Curso_de_Estadistica_Inferencial_con_R/blob/master/Notes/note.md
Teoría
Qué aprenderás y qué es Estadística Inferencial
Valor esperado condicional
Muestras y poblaciones
Muestreo
Estimadores y parámetros
Casos paramétricos y no paramétricos
El espacio de parámetros
Estimación puntual
Estimación por intervalo
Tamaño muestral
Sesgo y varianza
Teoría no paramétrica
Estimación funcional: una sola variable
Estimación funcional: valor esperado condicional
Bootstrapping
Validación cruzada
Introducción a las pruebas de hipótesis
Pruebas de hipótesis
Simulación
Teorías formales
Instalación de R
Explorando datos simulados
Simulando estimadores puntuales
Simulando intervalos de confianza
Observando el comportamiento del tamaño muestral
Estimando distribuciones simuladas
Red neuronal vs. regresión lineal
Examinando el sesgo y la varianza
Haciendo un bootstrapping a un modelo
Hagamos la validación cruzada
Revisemos la potencia de una prueba
Proyecto
Estimación de parámetros con datos reales
Estimación por intervalo de parámetros con datos reales
Red neuronal de pronóstico con datos reales
Validación cruzada de nuestra red neuronal
Calculando el tamaño óptimo de la muestra
Contextualización de la red neuronal
Conclusiones
¿Qué más sigue?
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
Julián Cruz
Aportes 6
Preguntas 1
Les comparto mis notas sobre este curso, espero les sean de utilidad
https://github.com/rb-one/Curso_de_Estadistica_Inferencial_con_R/blob/master/Notes/note.md
# Intervalos de confianza de la media -------------------------------------
table(SB11_20111$ECON_SN_INTERNET)
# ¿el internet tiene que ver con el puntaje en fisica?
tamano_muestral <- 300
iteraciones <- 100
poblacion_A <- SB11_20111$FISICA_PUNT[SB11_20111$ECON_SN_INTERNET == 0]
media_pob_A <- mean(poblacion_A, na.rm = TRUE)
poblacion_B <- SB11_20111$FISICA_PUNT[SB11_20111$ECON_SN_INTERNET == 1]
media_pob_B <- mean(poblacion_B, na.rm = TRUE)
plot(media_pob_A, media_pob_B, col = 4, pch= 20)
abline(0, 1)
for (i in seq_len(iteraciones)){
muestra <- sample(seq_len(nrow(SB11_20111)), tamano_muestral)
cuales_A <- seq_len(nrow(SB11_20111)) %in% muestra & SB11_20111$ECON_SN_INTERNET == 0
muestra_A <- SB11_20111$FISICA_PUNT[cuales_A]
media_muestral_A <- mean(muestra_A, na.rm = TRUE)
t_test_A <- t.test(muestra_A)
intervalo_A <- t_test_A$conf.int
LI_A <- min(intervalo_A)
LS_A <- max(intervalo_A)
cuales_B <- seq_len(nrow(SB11_20111)) %in% muestra & SB11_20111$ECON_SN_INTERNET == 1
muestra_B <- SB11_20111$FISICA_PUNT[cuales_B]
media_muestral_B <- mean(muestra_B, na.rm = TRUE)
t_test_B <- t.test(muestra_B)
intervalo_B <- t_test_B$conf.int
LI_B <- min(intervalo_B)
LS_B <- max(intervalo_B)
rect(LI_A, LI_B, LS_A, LS_B)
}
points(media_pob_A, media_pob_B, col = 4, pch = 20, cex = 4)
# Red neuronal de pronostico con datos reales -----------------------------
# Paquetes
library('nnet')
tamano_muestral <- 2000
c(
'ECON_PERSONAS_HOGAR',
'ECON_CUARTOS',
'ECON_SN_LAVADORA',
'ECON_SN_NEVERA',
'ECON_SN_HORNO',
'ECON_SN_DVD',
'ECON_SN_MICROHONDAS',
'ECON_SN_AUTOMOVIL',
'MATEMATICAS_PUNT'
) -> variables
indices_muestra <- seq_len(nrow(SB11_20111)) %in% sample(seq_len(nrow(SB11_20111)), tamano_muestral)
muestra <- subset(SB11_20111, subset = indices_muestra, select = variables)
muestra <- na.omit(muestra)
red_neuronal <- nnet(MATEMATICAS_PUNT ~ ., data = muestra, size = 10, linout= TRUE)
plot(muestra$MATEMATICAS_PUNT ~ predict(red_neuronal))
abline(0, 1, lwd = 2, col =2)
Clasifique las materias en ciencias exactas y ciencias sociales, y obtuve una mejor predicción de la puntuación en matemáticas.
Grafica ciencias exactas, “Biología, Física, Química”
Grafica ciencias sociales, “Lenguaje, Ciencias sociales, Filosofía, Inglés”
Les queria dejar mi notebook pero alguien dejo un mejor aporte @rubenbermudezrivera
https://colab.research.google.com/drive/13ETzG_S4yqa1li6iMXPET1HfYhfm_Yru?usp=sharing
Lo dejo igual
Tomando como variables las calificaciones de las demás materias.
✔ Mi resultado del reto con las variables
"ECON_SN_COMPUTADOR", “ECON_SN_INTERNET”, “FISICA_PUNT”, “QUIMICA_PUNT”, “MATEMATICAS_PUNT” (esta es nuestra y)
mejoró significativamente la posibilidad de predicción con esas variables, seguiré testeando más combinaciones pero esta me gustó bastante. 😁
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?