- 1

Inferencia Estadística: Fundamentos y Aplicaciones con Simulación en R
02:59 - 2

Valor Esperado Condicional en Ciencia de Datos
07:53 - 3

Poblaciones y Muestras: Conceptos y Generalización Estadística
03:51 - 4
Muestreo Probabilístico y No Probabilístico: Métodos y Aplicaciones
05:40 - 5

Estimadores y Parámetros en Ciencia de Datos
04:49 - 6

Estimación Paramétrica y No Paramétrica en Ciencia de Datos
04:16 - 7

Gráficos y Espacio de Parámetros en Modelos Estadísticos
04:35 - 8

Estimadores Puntuales y su Comportamiento Aleatorio
04:56 - 9

Intervalos de Confianza: Cálculo y Significado en Estadística
05:36 - 10

Tamaño Muestral y su Impacto en la Precisión Estadística
08:44 - 11

Sesgo y Varianza en Ciencia de Datos: Precisión y Exactitud
07:52 - 12

Teoría No Paramétrica: Estimación y Modelos Aplicados
04:48 - 13

Estimación Funcional: Kernel y Funciones de Densidad Acumulada
05:34 - 14

Estimación Funcional del Valor Esperado Condicional
03:21 - 15

Inferencia Estadística con Bootstrapping para Modelos Paramétricos
04:48 - 16

Validación Cruzada y Generalización de Modelos Estadísticos
04:50 - 17
Pruebas de Hipótesis: Conceptos y Aplicaciones Estadísticas
07:07 - 18

Pruebas de Hipótesis: P Valor y Significancia Estadística
02:43
Simulación de Datos en R: Distribuciones y Modelos Lineales
Clase 21 de 37 • Curso de Estadística Inferencial con R
Contenido del curso
- 19

Simulación de Datos con R: Teoría a la Práctica
05:30 - 20
Instalación de R y RStudio en Windows, macOS y Ubuntu
01:47 - 21

Simulación de Datos en R: Distribuciones y Modelos Lineales
12:18 - 22

Simulación de Estimación de Parámetros usando R
11:21 - 23

Simulación de Intervalos de Confianza para Poblaciones Normales
08:07 - 24

Simulación de Convergencia de Estimadores con Diferentes Tamaños Muestrales
10:41 - 25

Estimación Kernel y Distribución Acumulada Empírica
11:37 - 26

Estimación Condicional con Redes Neuronales en R
10:10 - 27

Estimación Kernel: Aplicación en Distribución Uniforme y Normal
07:34 - 28

Boostrapping en R para Regresión Lineal: Implementación y Análisis
19:25 - 29

Validación cruzada en redes neuronales usando R
16:32 - 30

Simulación de Potencia en Pruebas de Hipótesis con R
13:59
- 31

Análisis Estadístico del Examen Saber Once con R
08:02 - 32

Estimación de Intervalos de Confianza para Comparar Poblaciones con y sin Internet
16:22 - 33

Pronóstico de Puntaje en Matemáticas con Redes Neuronales
09:59 - 34

Generalización de Redes Neuronales a Poblaciones Completas
10:06 - 35

Análisis de Tamaño Muestral Óptimo para Redes Neuronales
09:16 - 36

Interpretación de Redes Neuronales en Predicción Educativa
09:46
¿Cómo simular datos en R?
Simular datos es esencial para estadísticas, machine learning y análisis avanzados. Con R, puedes hacerlo eficientemente, gracias a su robusta base de funciones. Aprenderemos a simular datos de distribuciones normales, uniformes y modelos (lineales y no lineales), utilizando solo las funciones básicas de R.
¿Cómo generar datos con distribución normal y uniforme?
Simular datos a partir de distribuciones conocidas nos permite modelar situaciones reales y comprender mejor el comportamiento de diferentes variables.
Distribución normal
Para simular datos de una distribución normal estándar, R ofrece la función rnorm. A continuación, un ejemplo que genera 100 valores de una distribución normal con media cero y desviación estándar uno:
valores_normales <- rnorm(100)
Para observar la distribución, puedes usar una gráfica básica del paquete base de R:
plot(density(valores_normales), main = "Densidad de la distribución normal")
Si deseas modificar los parámetros, puedes especificar una media diferente y una desviación estándar distinta:
valores_normales_modificados <- rnorm(100, mean = 5, sd = 3)
Distribución uniforme
Simular datos de una distribución uniforme es igualmente sencillo con la función runif. Por ejemplo, para generar 100 observaciones entre cero y uno:
valores_uniformes <- runif(100)
plot(density(valores_uniformes), main = "Densidad de la distribución uniforme")
Para establecer un rango diferente, simplemente ajusta los parámetros de mínimo y máximo:
valores_uniformes_modificados <- runif(100, min = 3, max = 8)
¿Cómo crear y visualizar tablas de datos simulados?
Para simular datos más complejos en un contexto específico, consideremos un ejemplo con diferentes grupos (escuela, preparatoria, universidad) y sus respectivas edades:
# Simulación de datos para diferentes grupos
escuela <- data.frame(edad = rnorm(50, mean = 10, sd = 1.2), lugar = "escuela")
prepa <- data.frame(edad = rnorm(45, mean = 15, sd = 1.9), lugar = "preparatoria")
universidad <- data.frame(edad = rnorm(80, mean = 21, sd = 2.5), lugar = "universidad")
# Combinar tablas en una sola
edad_lugar <- rbind(escuela, prepa, universidad)
# Visualización con boxplot
boxplot(edad_lugar$edad ~ edad_lugar$lugar, main = "Distribución de edades por lugar")
¿Cómo simular modelos lineales y no lineales?
Crear modelos simulados permite analizar cómo varían las variables y predecir resultados potenciales.
Modelo lineal
Un ejemplo de modelo lineal puede estructurarse como sigue:
x <- seq(0, 3*pi, length.out = 100)
z <- -0.3*x + 1
y <- z + rnorm(100, mean = 0, sd = 0.5)
datos_lineal <- data.frame(x, y)
plot(y ~ x, data = datos_lineal, main = "Modelo lineal")
lines(z ~ x, data = datos_lineal, col = 2, lwd = 2)
Modelo no lineal
La práctica para un modelo no lineal es similar, excepto que la relación entre variables cambia:
z_nl <- cos(x)
y_nl <- z_nl + rnorm(100, mean = 0, sd = 0.5)
datos_nolineal <- data.frame(x, y_nl)
plot(y_nl ~ x, data = datos_nolineal, main = "Modelo no lineal")
lines(z_nl ~ x, data = datos_nolineal, col = 2, lwd = 2)
Esto solo es el principio del potencial de simulación con R, y te permite analizar diversas situaciones hipotéticas de manera ordenada y eficiente. ¡Sigue explorando y perfeccionando tus habilidades en R! En la próxima clase, profundizaremos más en cómo estimar parámetros efectivos usando R. ¡Nos vemos allí!