No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Aprende todo un fin de semana sin pagar una suscripción 🔥

Aprende todo un fin de semana sin pagar una suscripción 🔥

Regístrate

Comienza en:

4D
3H
3M
9S

Implicaciones de los distintos tipos de valores faltantes

4/17
Recursos

Aportes 3

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

o inicia sesión.

Copiar y pegar ( si quieren obvio xD sino no)

MCAR

La localización de los valores faltantes en el conjunto de datos ocurren completamente al azar, estos no dependen de ningún otro dato

Eliminación de valores faltantes

  • Reducción del tamaño de muestra.
  • Inferencia limitada.
  • No produce sesgos

Imputación de valores faltantes

  • De hacerlo bien, no produce sesgos
  • La imputación es recomendada sobre la deleción.

MAR

La localización de los valores faltantes en el conjunto de datos dependen de otros valores observados.

Eliminación de valores faltantes

  • Ignorarlos produce sesgos

Imputación de valores faltantes

  • La mayor parte de métodos de imputación asumen MAR
  • La imputación es necesaria

MNAR

La localización de los valores faltantes en el conjunto de datos dependen de otros valores faltantes en sí mismos.

Eliminación de valores faltantes

  • Ignorarlos produce sesgos

Imputación de valores faltantes

  • La imputación es recomendada sobre la deleción.

💡 Mejorar experimentos o realizar análisis de sensibilidad (repetir los experimentos, explorar los parámetros, ver como cambian los análisis al modificar algunos datos y establecer intervalos de confianza)

Tuve que preguntarle a ChatGPT porque no entendí bien el tema, pero ahora me ha quedado claro:

El código realiza una prueba t-test independiente usando la función ttest_ind del módulo scipy.stats. La prueba t-test comparará la media de dos grupos de datos y determinará si existe una diferencia significativa entre ellos.

El primer argumento a es el primer grupo de datos (female_weight) y el segundo argumento b es el segundo grupo de datos (male_weight).

El argumento alternative especifica el tipo de hipótesis nula a probar, en este caso “two-sided” indica que se está realizando una prueba two-tailed, es decir, se está investigando si existe una diferencia significativa entre las dos medias, sin importar en qué dirección.

El resultado es el valor estadístico y el valor p del test t-test independiente entre dos grupos “female_weight” y “male_weight”. La hipótesis nula es que la media de ambos grupos es igual.

El valor p obtenido es de 0.717, lo que sugiere que no hay suficiente evidencia para rechazar la hipótesis nula. Por lo tanto, no se puede concluir que la media de los dos grupos sea diferente.

El valor absoluto del estadístico t, 0.362, es bajo, lo que indica que las diferencias entre los dos grupos son poco significativas.

vimos los tipos de datos y su metodo metodo a aplicar:

  • mar : inputacion
  • mat : inputacion multiple
  • mnar: mejorar experimentos