¿Por qué explorar y lidiar con valores faltantes?

1/21
Recursos

Aportes 30

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Ignorar los valores faltantes puede introducir sesgos en tu analisis y modelo

Multiple de los algoritmos disponibles fallaran. Los algoritmos no saben lidiar con los valores faltantes por lo que terminaran eliminadolo.

La mejor manera de tratar los datos que faltan es no tenerlos, pero la realidad es que muchos conjuntos de datos van a tener valores faltantes por lo que debes saber tratarlos y entenderlos.

Muy emocionado que ya este disponible el curso!!! para seguir profundizando en el análisis de los datos

aun con una muestra significativa y sin datos faltantes, no se puede afirmar que alguien gana mas o menos solo con el promedio. Se hace una prueba estadística, como la prueba-T o Wilcoxon

¡Con esa primera clase y ese ejemplo, dan ganas de hacer el curso que buen ejemplo!

Explorar y Lidiar con Valores Faltantes

  1. Integridad de los Datos:

    • Los valores faltantes pueden afectar la integridad de tus datos. Si no se abordan adecuadamente, podrían llevar a interpretaciones incorrectas y conclusiones erróneas.
  2. Impacto en el Análisis Estadístico:

    • La presencia de datos faltantes puede sesgar los resultados de análisis estadísticos y métricas. Si no se manejan, podrían afectar la validez de las inferencias realizadas a partir de tus datos.
  3. Modelado Predictivo:

    • En el contexto de la construcción de modelos predictivos, los modelos suelen requerir datos completos. La presencia de valores faltantes puede afectar negativamente el rendimiento del modelo y su capacidad para hacer predicciones precisas.
  4. Distribución de Datos:

    • Los valores faltantes pueden afectar la distribución de tus datos. Esto es importante porque muchos métodos estadísticos y modelos asumen que los datos siguen ciertas distribuciones.
  5. Eficiencia de los Modelos de Aprendizaje Automático:

    • Muchos algoritmos de aprendizaje automático no pueden manejar directamente valores faltantes. Por lo tanto, es necesario abordar este problema para poder aplicar estos modelos de manera efectiva.
  6. Credibilidad y Confianza:

    • En entornos científicos, empresariales y académicos, la credibilidad y la confianza en los resultados dependen en gran medida de la calidad de los datos. Lidiar con valores faltantes mejora la calidad y la fiabilidad de tus resultados.
  7. Eficiencia Operativa:

    • En situaciones prácticas, como en entornos empresariales, la eficiencia operativa puede depender de datos completos y precisos. El manejo adecuado de valores faltantes puede mejorar la toma de decisiones y las operaciones.
  8. Cumplimiento Normativo:

    • En ciertos sectores, como la atención médica y las finanzas, el cumplimiento normativo puede requerir la gestión adecuada de datos faltantes para garantizar la precisión y la transparencia.

En resumen, explorar y lidiar con valores faltantes es esencial para garantizar que tus datos sean confiables, que tus análisis sean válidos y que tus modelos sean precisos. Ignorar este aspecto puede conducir a interpretaciones incorrectas y decisiones erróneas basadas en datos incompletos.

En mi trabajo como analista de mercado electrico, muchas veces ocurre que no se capturan mediciones de consumo o generacion por falla de los equipos y este curso me puede ser util para aprender a como completar faltantes
Comencemos!! 🏎️💨

Wow, muy buena introducción al curso

1. ¿Por qué explorar y lidiar con valores faltantes?

  • Ignorar los valores faltantes puede introducir sesgos en tus análisis y modelos.
  • Múltiples de los algoritmos disponibles fallarán.
  • Obviamente, la mejor manera de tratar los datos que faltan es no tenerlos.
Esta encuesta debió incluir en que trabajan esas personas.

Gracias @Platzi por este curso, tenia tiempo sin saber si mis soluciones a la hora de enfrentarme a datos faltantes eran optimas. Ahora lo sabre con este curso 😉

Entiendo que nunca vamos a tener certeza de cual es la solución correcta, pero aun así creo que lo mas importante es entender porque hacemos las cosas. He trabajo con bases de datos con bastantes datos faltantes, por el tamaño de la base de datos elimine las filas, no era un cambio significativo, pero cuando son bases pequeñas si es muy problemático eliminar filas enteras por tener datos faltantes, quiero saber cuales son las formas de solucionarlo, ventajas y desventajas. 🤓
Este manejo de valores faltantes es más importante de lo que podemos pensar al inicio.
Hola. Para los que están comenzando con el curso les quiero adelantar que hay algunos errores con la librería y las dependencias utilizadas. Por ello hice un repositorio donde incluyo versiones estables y que ya fueron probadas en todas las clases (Acabo de aprobar el curso). Les dejo el repositorio para que puedan clonarlo y usarlo en VSCode: <https://github.com/onnymm/missing_data_exploration>
**Para llegar a una conclusión solida, se logran con tratar con datos faltantes.** Ignorarlo causa ***fallas o sesgos*** en nuestro análisis y resultados. Si te quieres ahorrar dolores de cabeza aprendamos a tratar estos problemas. El no hacerlo, nos dirige a un resultado poco creíble, y la ética de nuestro trabajo es ser lo mas claros y TRASNPARENTES posibles. :) Vamos a ello.!!1
Me gustan mucho los ejemplos que pone el profesor en estos cursos.
Manejar los datos faltantes y en algunos casos entender la ausencia de estos es fundamental, pues cuando estemos realizando análisis o entrenando modelos de ML podemos llegar a conclusiones equivocadas, y modelos sesgados. Como lo algoritmos no son capaces de tratar con datos incompletos, es labor del investigador o Data Scientist darles un manejo y tratamiento adecuado según el caso de uso.

Paradoja de Simpson

Valores faltantes pueden introducir sesgos (desviaciones) en el análisis y modelos

En resumen, explorar y lidiar con valores faltantes es un paso crítico en el proceso de análisis de datos. Ayuda a garantizar la validez, la calidad y la utilidad de tus resultados, lo que a su vez respalda la toma de decisiones informadas y confiables.

Recuerda que no existe una única solución universal para manejar los datos faltantes, ya que la elección de la estrategia dependerá de la naturaleza de tus datos y del objetivo de tu análisis. Además, es importante ser transparente acerca del manejo de datos faltantes en tus informes y análisis para que otros puedan evaluar la calidad de tu trabajo.

Y que hacer en una encuesta cuando no se tienen mas datos? o quizas los datos que no se tienen, porque no se encuestaron no son faltantes?

Vamos a darle con TODA!

Me parece que el pre-procesamiento y el procesamiento de los datos, es el zen o nucleo de la ciencia.

Genial, tengo grandes expectativas de este curso

Solo dire que estoy emocianado

Bueno, arrancamos este curso, tengo muy buenas expectativas.

Vamos a sacarle sesgos a nuestros análisis y hacer de nuestro trabajo una mejor foto de la realidad.

Aquí vamos…

Excelente! Justamente me encontre, en mis analisis con varios dataset que tenian datos faltantes.