No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Bootstrapping

15/37
Recursos

Aportes 11

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Este concepto de bootstrapping me parecía similar al cross-validation. Efectivamente, bootstrapping es una generalazición de cross-validation:https://online.stat.psu.edu/stat555/node/119/

https://www.youtube.com/watch?v=wS0YvDC65nc

Si el Dr. E. Brown, no pudo, yo tampoco que soy un simple mortal 😛

Bradley Efron habla del metodo que él impulsó, el Bootstrapping:
https://www.youtube.com/watch?v=Cx5pgZCdDGM

El bootstrapping en estadística y probabilidad es una técnica que se utiliza para estimar la incertidumbre de una medida estadística mediante la generación de muestras ficticias a partir de los datos originales.

Supongamos que estás interesado en conocer la altura promedio de los estudiantes de una escuela. Sin embargo, no puedes medir a todos los estudiantes, así que tomas una muestra de 100 estudiantes y registras sus alturas.

En lugar de hacer suposiciones complicadas sobre cómo se distribuyen las alturas en toda la población de estudiantes, decides utilizar el bootstrapping para obtener una estimación de la incertidumbre en la altura promedio.

Aquí está el proceso del bootstrapping:

Tienes tu muestra de 100 alturas de los estudiantes.
Ahora, generas muestras ficticias a partir de tu muestra original. Esto significa que seleccionas aleatoriamente una altura de tu muestra y la vuelves a colocar en una nueva muestra ficticia. Repites este proceso muchas veces (digamos 1,000 veces) para obtener 1,000 muestras ficticias.
Para cada una de las 1,000 muestras ficticias, calculas la altura promedio.
Al finalizar, tendrás 1,000 estimaciones de la altura promedio.
A partir de estas estimaciones, puedes calcular un intervalo de confianza para la altura promedio. Por ejemplo, puedes decir que existe un 95% de confianza de que la altura promedio real de todos los estudiantes está dentro de ese intervalo.
El bootstrapping te proporciona una manera de obtener una estimación más precisa de la altura promedio y de comprender la incertidumbre asociada a esa estimación, sin hacer suposiciones complicadas sobre la distribución de las alturas en la población completa.

Bootstrapping uses the observed data to simulate resampling from the population. This produces a large number of bootstrap resamples. We can calculate a statistic for each bootstrap resample and use the distribution of the simulated statistics to approximate characteristics of the population. This video lays the foundation for later bootstrap video series.

● Una muestra aleatoria de una muestra
aleatoria es una muestra aleatoria.
● Las estimaciones de submuestras son
una muestra aleatoria del estimador.
● Es posible usar esta muestra para tener
un intervalo de confianza.

![](https://static.platzi.com/media/user_upload/image-6578b6fc-8146-49f2-8cd2-2332dfb9f272.jpg) ### Aplicaciones: * **Estimación de intervalos de confianza**: Proporcionar una idea de la incertidumbre de una estimación sin asumir normalidad en la distribución. * **Pruebas de hipótesis**: Verificar hipótesis estadísticas cuando los supuestos clásicos no se cumplen. * **Machine learning**: Utilizado en métodos como el *bagging*, que incluye algoritmos como *Random Forest*.

Explicación de la finalidad del Bootstrapping.

¿Qué es el Bootstrapping?
Aquí les dejo unos videos donde lo explican de forma detallada y amena.
Ejemplos de código en R y todo:

https://www.youtube.com/watch?v=QWJHPwGblXI

https://www.youtube.com/watch?v=OQiW1mCCWPY&t=900s

Especialmente útil
cuando un modelo
paramétrico no cumple
los supuestos