CursosEmpresasBlogLiveConfPrecios

Continúa aprendiendo sobre el manejo de valores faltantes

Clase 21 de 21 • Curso de Manejo de Datos Faltantes: Detección y Exploración

Clase anteriorSiguiente clase

Contenido del curso

Introducción a los valores faltantes
  • 1
    ¿Por qué explorar y lidiar con valores faltantes?

    ¿Por qué explorar y lidiar con valores faltantes?

    06:59
  • 2
    Operaciones con valores faltantes

    Operaciones con valores faltantes

    13:52
  • 3
    Conociendo datasets para manejo de datos faltantes

    Conociendo datasets para manejo de datos faltantes

    09:01
  • 4

    Ejecución de Notebooks en Deepnote con %run

    01:07
  • 5
    Extendiendo la API de Pandas

    Extendiendo la API de Pandas

    14:03
  • 6
    Tabulación de valores faltantes

    Tabulación de valores faltantes

    16:58
  • 7
    Visualización de valores faltantes

    Visualización de valores faltantes

    12:04
Manipulación inicial de valores faltantes
  • 8
    Codificación de valores faltantes

    Codificación de valores faltantes

    13:10
  • 9
    Conversión de valores faltantes implícitos en explícitos

    Conversión de valores faltantes implícitos en explícitos

    08:57
  • 10
    Exponer filas faltantes implícitas en explícitas

    Exponer filas faltantes implícitas en explícitas

    07:59
  • 11
    Tipos de valores faltantes

    Tipos de valores faltantes

    05:51
  • 12
    MCAR, MAR, MNAR en Python

    MCAR, MAR, MNAR en Python

    08:51
Búsqueda de relaciones de valores faltantes
  • 13
    Matriz de sombras: shadow matrix

    Matriz de sombras: shadow matrix

    14:34
  • 14
    Visualización de valores faltantes en una variable

    Visualización de valores faltantes en una variable

    10:06
  • 15
    Visualización de valores faltantes en dos variables

    Visualización de valores faltantes en dos variables

    10:00
  • 16
    Scatterplot con valores faltantes

    Scatterplot con valores faltantes

    09:42
  • 17
    Correlación de nulidad

    Correlación de nulidad

    07:00
Tratamiento de valores faltantes
  • 18
    Eliminación de valores faltantes: pairwise y listwise

    Eliminación de valores faltantes: pairwise y listwise

    14:28
  • 19
    Imputación básica de datos

    Imputación básica de datos

    10:53
  • 20
    Bonus: visualización múltiple de imputaciones

    Bonus: visualización múltiple de imputaciones

    07:50
Cierre de curso
  • 21
    Continúa aprendiendo sobre el manejo de valores faltantes

    Continúa aprendiendo sobre el manejo de valores faltantes

    03:21
    Juan Jose Ramirez Lopez

    Juan Jose Ramirez Lopez

    student•
    hace 2 años

    No me gustó el curso. Si bien hace buenas prácticas para explorar valores faltantes incluso implícitos, la mayoría de los casos se hace uso de la extensión del API de pandas, la cual no explica como funciona y a pesar de eso, a hoy 16 de Junio de 2023, muchas funciones dentro del Notebook no funcionan. Creo que deberían actualizar el Notebook y darnos el mismo para que lo podamos usar a lo largo del curso. Tuve que documentarme en otros lados para poder arreglarlo y creo que ese no es el objetivo. Mal ahí

      Diego Jurado

      Diego Jurado

      student•
      hace 2 años

      Lo bueno es que seguro quedaste con mucha mas información que solo la del curso.

      Pável Hernández Reza

      Pável Hernández Reza

      student•
      hace un año

      Pasé por lo mismo y al principio me sentí frustrado. La verdad es que me puse a hacer manualmente todo lo que la extensión hace, método por método y terminé desarrollando muy buenas habilidades en la manipulación del DataFrame lo que me facilitó tomar el resto del curso. Si la vida te da limones, haz limonada :)

    Alfonso Andres Zapata Guzman

    Alfonso Andres Zapata Guzman

    student•
    hace 3 años

    Posiblemente haya un error en la pregunta de la prueba:

    ¿Qué significa la eliminación de valores faltantes por el método pairwise?

    Se pregunta por pairwise, pero las respuestas tratan sobre la eliminacion listwise o al menos hace mencion a ella.

      Alberto Duque Villegas

      Alberto Duque Villegas

      student•
      hace 2 años

      De acuerdo. Pero el error está en la utilización de la expresión "listwise" en las dos opciones de respuesta... Basta por leerlas como si dijeran "pairwise".

    José Pablo Cabrera Romo

    José Pablo Cabrera Romo

    student•
    hace 2 años

    ¡Excelente curso! Me pude dar cuenta que tengo áreas de oportunidad en ciertos temas, pero gracias a este curso me di cuenta de que es en lo que tengo que trabajar, el chiste es no detenerse y buscar la solución por uno mismo, ya que lo que se me presente aquí, muy probablemente se me va a presentar laboralmente y no puedo cerrarme.

    Andres Felipe Vargas

    Andres Felipe Vargas

    student•
    hace un año

    Yo veo todo lo que hace el profesor y la verdad me siento super perdido. Aveces hace cosas como lo de common_bins dentro de displot o facet_kws y me digo ¿Cómo hace para saber eso? Hoy me sentí perdido y frustrado, pero espero en un futuro poder entender todo esto.

      Eduardo Barea

      Eduardo Barea

      student•
      hace un año

      Así me pasaba cuando empecé compañero; entre las muchas alternativas para que no te pierdas de comparto la mia: PRACTÍCA; comete errores y date la oportunidad de fallar. Solo así se mejora; con la práctica notarás grandes resultados!!

    Jorge Andres Avendano Carabali

    Jorge Andres Avendano Carabali

    student•
    hace 2 años

    test Annswers Resumen 1. ¿Por qué deberías explorar y lidiar con los valores faltantes? Al encontrar valores faltantes en los datos, es necesario explorarlos y entenderlos para evitar producir sesgos en los resultados e incluso evitar problemas en la creación de modelos. 2. Responde si la siguiente sentencia es verdadera o falsa:

    A pesar de que la mejor manera de tratar a los datos que faltan es no tenerlos, esto es pasa con una frecuencia baja. Por lo tanto, deberemos aprender cómo tratarlos apropiadamente.

    Verdadera 3. A lo largo de tu carrera como científica de datos utilizarás distintas herramientas de software. ¿Qué es algo que siempre debes aprender para cada herramienta al tratar valores faltantes? Sus operaciones y representaciones de los valores faltantes. 4. Recolectar datos es una tarea del día a día de una científica de datos. Puedes combinar el poder de interactividad de los jupyter notebooks junto con la versatilidad del uso de la línea de comandos para conseguir hacer este proceso automático en un ambiente familiar. ¿Esto es verdadero o falso?

    Verdadero 5. Pandas es una librería increíble para el manejo de datos tabulares, no obstante, sus métodos y estructuras pueden no satisfacer tus necesidades completamente. Para ello, Pandas ofrece opciones para extenderlo y ajustarlo a tus requerimientos. ¿Cuál de los siguientes decoradores puede ayudarte a registrar un acceso a funciones y propiedades de un DataFrame?

    pandas.api.extensions.register_dataframe_accessor() 6. Tabular es una forma práctica de expresar valores, magnitudes u otros datos por medio de tablas, pero antes de llegar a una tabla, siempre es bueno comenzar con ___. Resúmenes simples, como números. 7. Al trabajar con datos temporales, la pregunta "¿Cuál es mi racha de valores completos y faltantes en una variable?" Puede ser importante por que ___. Permite encontrar fechas / períodos en los cuales esté acumulando valores faltantes. Lo que permite continuar investigando en esos períodos y entender el por qué de la ausencia de valores. 8. ¿Por qué deberías visualizar tus valores faltantes? La visualización de datos hace sencillo visualizar tendencias, patrones y datos atípicos en nuestro conjunto de datos. REPASAR CLASE 9. La siguiente sentencia es verdadera o falsa:

    Los valores faltantes siempre son representados como NA.

    Verdadera REPASAR CLASE 10. ¿Qué puedes concluir de la siguiente afirmación? Asumir que los valores faltantes siempre vendrán en un único formato es un error, pero asumir que siempre seremos capaces de detectar la ausencia de valores es un error aún mayor. Los valores faltantes pueden tomar distintas formas dentro de un conjunto de datos, pero también pueden no estar incluidas de forma directa dentro del espacio observable. 11. ¿Qué significa que puedan existir valores faltantes implícitos? Un valor faltante implícito indica que el valor faltante debería estar incluido en el conjunto de datos, sin que éste lo diga o lo especifique de forma directa. 12. ¿Cuál de las siguientes estrategias no corresponde a un método para encontrar valores faltantes implícitos? Ninguna de las respuestas es correcta. 13. ¿Cuál de los siguientes elementos es un mecanismo de acción de los valores faltantes? Todos son un mecanismo de acción de los valores faltantes. 14. Llegas a tu trabajo y observas que algunas personas faltan, pero realmente sabes que la ausencia de estas personas no está ligada entre sí. ¿Qué tipo de mecanismo de valores faltantes podría estar actuando? Missing Completely At Random (MCAR). 15. Llegas a tu trabajo y observas que todos los amigos de Lynn se encuentran ausentes, sin excepción. ¿Qué tipo de mecanismo de valores faltantes podría estar actuando? Missing Not At Random (MNAR). 16. ¿Cuál no es una característica de la matriz de sombras? Valores implícitos. 17. ¿Qué es la matriz de sombras? Es una matriz que tiene las mismas dimensiones que los datos originales, y consiste de indicadores binarios para los valores faltantes, donde los valores faltantes son representados explícitamente.

    Una gráfica de puntos es muy útil para visualizar relaciones entre variables. No obstante, si al menos una de las dos variables tiene valores faltantes, estos puntos no serán dibujados. ¿Cómo podrías solventar este problema para continuar explorando sin agregar ruido a tus datos reales? Agregar valores dummy a los valores faltantes para visualizarlos en los marginales de la gráfica de puntos y observar su distribución en cada eje. 19. ¿Qué significa cuantificar la correlación de nulidad? La correlación de nulidad cuantifica qué tan fuerte la presencia o ausencia de una variable afecta la presencia o ausencia de otra. 20. ¿Qué significa que una variable tenga una correlación de nulidad de -1, 0 o 1 con otra variable? Si la correlación es -1, si una variable aparece la otra seguramente no. Si la correlación es 0, la presencia u ausencia de una variable no afecta la de otra. La correlación de 1 indica que si una variable aparece la otra también lo hará. 21. ¿Qué busca mostrar el gráfico de dendograma de nulidad? Agrupar columnas que tiene una alta correlación de nulidad. 22. ¿Qué alternativas existen para tratar valores faltantes? Eliminación e Imputación de valores faltantes o realizar una nueva colecta de datos. 23. ¿Qué significa la eliminación de valores faltantes por el método pairwise? En la eliminación listwise, la eliminación ocurre cuando un procedimiento usa casos que contienen valores faltantes. El procedimiento no incluye una variable particular cuando existe un valor falte, pero puede utilizar otras variable sin valores faltantes. 24. ¿Qué es la imputación de valores faltantes? Estimar los valores ausentes con base a los valores de otras variables o modelos predictivos. 25. ¿Cuál podría ser una desventaja de la imputación de un único valor como la media, mediana o moda? Puede sesgar los resultados y perder la correlación entre variables. Ver menos

    Julián Cárdenas

    Julián Cárdenas

    student•
    hace 2 años

    ¡Muy buen curso!

    Mario Alexander Vargas Celis

    Mario Alexander Vargas Celis

    student•
    hace un año

    excelente curso

Escuelas

  • Desarrollo Web
    • Fundamentos del Desarrollo Web Profesional
    • Diseño y Desarrollo Frontend
    • Desarrollo Frontend con JavaScript
    • Desarrollo Frontend con Vue.js
    • Desarrollo Frontend con Angular
    • Desarrollo Frontend con React.js
    • Desarrollo Backend con Node.js
    • Desarrollo Backend con Python
    • Desarrollo Backend con Java
    • Desarrollo Backend con PHP
    • Desarrollo Backend con Ruby
    • Bases de Datos para Web
    • Seguridad Web & API
    • Testing Automatizado y QA para Web
    • Arquitecturas Web Modernas y Escalabilidad
    • DevOps y Cloud para Desarrolladores Web
  • English Academy
    • Inglés Básico A1
    • Inglés Básico A2
    • Inglés Intermedio B1
    • Inglés Intermedio Alto B2
    • Inglés Avanzado C1
    • Inglés para Propósitos Específicos
    • Inglés de Negocios
  • Marketing Digital
    • Fundamentos de Marketing Digital
    • Marketing de Contenidos y Redacción Persuasiva
    • SEO y Posicionamiento Web
    • Social Media Marketing y Community Management
    • Publicidad Digital y Paid Media
    • Analítica Digital y Optimización (CRO)
    • Estrategia de Marketing y Growth
    • Marketing de Marca y Comunicación Estratégica
    • Marketing para E-commerce
    • Marketing B2B
    • Inteligencia Artificial Aplicada al Marketing
    • Automatización del Marketing
    • Marca Personal y Marketing Freelance
    • Ventas y Experiencia del Cliente
    • Creación de Contenido para Redes Sociales
  • Inteligencia Artificial y Data Science
    • Fundamentos de Data Science y AI
    • Análisis y Visualización de Datos
    • Machine Learning y Deep Learning
    • Data Engineer
    • Inteligencia Artificial para la Productividad
    • Desarrollo de Aplicaciones con IA
    • AI Software Engineer
  • Ciberseguridad
    • Fundamentos de Ciberseguridad
    • Hacking Ético y Pentesting (Red Team)
    • Análisis de Malware e Ingeniería Forense
    • Seguridad Defensiva y Cumplimiento (Blue Team)
    • Ciberseguridad Estratégica
  • Liderazgo y Habilidades Blandas
    • Fundamentos de Habilidades Profesionales
    • Liderazgo y Gestión de Equipos
    • Comunicación Avanzada y Oratoria
    • Negociación y Resolución de Conflictos
    • Inteligencia Emocional y Autogestión
    • Productividad y Herramientas Digitales
    • Gestión de Proyectos y Metodologías Ágiles
    • Desarrollo de Carrera y Marca Personal
    • Diversidad, Inclusión y Entorno Laboral Saludable
    • Filosofía y Estrategia para Líderes
  • Diseño de Producto y UX
    • Fundamentos de Diseño UX/UI
    • Investigación de Usuarios (UX Research)
    • Arquitectura de Información y Usabilidad
    • Diseño de Interfaces y Prototipado (UI Design)
    • Sistemas de Diseño y DesignOps
    • Redacción UX (UX Writing)
    • Creatividad e Innovación en Diseño
    • Diseño Accesible e Inclusivo
    • Diseño Asistido por Inteligencia Artificial
    • Gestión de Producto y Liderazgo en Diseño
    • Diseño de Interacciones Emergentes (VUI/VR)
    • Desarrollo Web para Diseñadores
    • Diseño y Prototipado No-Code
  • Contenido Audiovisual
    • Fundamentos de Producción Audiovisual
    • Producción de Video para Plataformas Digitales
    • Producción de Audio y Podcast
    • Fotografía y Diseño Gráfico para Contenido Digital
    • Motion Graphics y Animación
    • Contenido Interactivo y Realidad Aumentada
    • Estrategia, Marketing y Monetización de Contenidos
  • Desarrollo Móvil
    • Fundamentos de Desarrollo Móvil
    • Desarrollo Nativo Android con Kotlin
    • Desarrollo Nativo iOS con Swift
    • Desarrollo Multiplataforma con React Native
    • Desarrollo Multiplataforma con Flutter
    • Arquitectura y Patrones de Diseño Móvil
    • Integración de APIs y Persistencia Móvil
    • Testing y Despliegue en Móvil
    • Diseño UX/UI para Móviles
  • Diseño Gráfico y Arte Digital
    • Fundamentos del Diseño Gráfico y Digital
    • Diseño de Identidad Visual y Branding
    • Ilustración Digital y Arte Conceptual
    • Diseño Editorial y de Empaques
    • Motion Graphics y Animación 3D
    • Diseño Gráfico Asistido por Inteligencia Artificial
    • Creatividad e Innovación en Diseño
  • Programación
    • Fundamentos de Programación e Ingeniería de Software
    • Herramientas de IA para el trabajo
    • Matemáticas para Programación
    • Programación con Python
    • Programación con JavaScript
    • Programación con TypeScript
    • Programación Orientada a Objetos con Java
    • Desarrollo con C# y .NET
    • Programación con PHP
    • Programación con Go y Rust
    • Programación Móvil con Swift y Kotlin
    • Programación con C y C++
    • Administración Básica de Servidores Linux
  • Negocios
    • Fundamentos de Negocios y Emprendimiento
    • Estrategia y Crecimiento Empresarial
    • Finanzas Personales y Corporativas
    • Inversión en Mercados Financieros
    • Ventas, CRM y Experiencia del Cliente
    • Operaciones, Logística y E-commerce
    • Gestión de Proyectos y Metodologías Ágiles
    • Aspectos Legales y Cumplimiento
    • Habilidades Directivas y Crecimiento Profesional
    • Diversidad e Inclusión en el Entorno Laboral
    • Herramientas Digitales y Automatización para Negocios
  • Blockchain y Web3
    • Fundamentos de Blockchain y Web3
    • Desarrollo de Smart Contracts y dApps
    • Finanzas Descentralizadas (DeFi)
    • NFTs y Economía de Creadores
    • Seguridad Blockchain
    • Ecosistemas Blockchain Alternativos (No-EVM)
    • Producto, Marketing y Legal en Web3
  • Recursos Humanos
    • Fundamentos y Cultura Organizacional en RRHH
    • Atracción y Selección de Talento
    • Cultura y Employee Experience
    • Gestión y Desarrollo de Talento
    • Desarrollo y Evaluación de Liderazgo
    • Diversidad, Equidad e Inclusión
    • AI y Automatización en Recursos Humanos
    • Tecnología y Automatización en RRHH
  • Finanzas e Inversiones
    • Fundamentos de Finanzas Personales y Corporativas
    • Análisis y Valoración Financiera
    • Inversión y Mercados de Capitales
    • Finanzas Descentralizadas (DeFi) y Criptoactivos
    • Finanzas y Estrategia para Startups
    • Inteligencia Artificial Aplicada a Finanzas
    • Domina Excel
    • Financial Analyst
    • Conseguir trabajo en Finanzas e Inversiones
  • Startups
    • Fundamentos y Validación de Ideas
    • Estrategia de Negocio y Product-Market Fit
    • Desarrollo de Producto y Operaciones Lean
    • Finanzas, Legal y Fundraising
    • Marketing, Ventas y Growth para Startups
    • Cultura, Talento y Liderazgo
    • Finanzas y Operaciones en Ecommerce
    • Startups Web3 y Blockchain
    • Startups con Impacto Social
    • Expansión y Ecosistema Startup
  • Cloud Computing y DevOps
    • Fundamentos de Cloud y DevOps
    • Administración de Servidores Linux
    • Contenerización y Orquestación
    • Infraestructura como Código (IaC) y CI/CD
    • Amazon Web Services
    • Microsoft Azure
    • Serverless y Observabilidad
    • Certificaciones Cloud (Preparación)
    • Plataforma Cloud GCP

Platzi y comunidad

  • Platzi Business
  • Live Classes
  • Lanzamientos
  • Executive Program
  • Trabaja con nosotros
  • Podcast

Recursos

  • Manual de Marca

Soporte

  • Preguntas Frecuentes
  • Contáctanos

Legal

  • Términos y Condiciones
  • Privacidad
  • Tyc promociones
Reconocimientos
Reconocimientos
Logo reconocimientoTop 40 Mejores EdTech del mundo · 2024
Logo reconocimientoPrimera Startup Latina admitida en YC · 2014
Logo reconocimientoPrimera Startup EdTech · 2018
Logo reconocimientoCEO Ganador Medalla por la Educación T4 & HP · 2024
Logo reconocimientoCEO Mejor Emprendedor del año · 2024
De LATAM conpara el mundo
YoutubeInstagramLinkedInTikTokFacebookX (Twitter)Threads