CursosEmpresasBlogLiveConfPrecios

Bonus: visualización múltiple de imputaciones

Clase 20 de 21 • Curso de Manejo de Datos Faltantes: Detección y Exploración

Contenido del curso

Introducción a los valores faltantes

  • 1
    ¿Por qué explorar y lidiar con valores faltantes?

    ¿Por qué explorar y lidiar con valores faltantes?

    06:59 min
  • 2
    Operaciones con valores faltantes

    Operaciones con valores faltantes

    13:52 min
  • 3
    Conociendo datasets para manejo de datos faltantes

    Conociendo datasets para manejo de datos faltantes

    09:01 min
  • 4

    Ejecución de Notebooks en Deepnote con %run

    01:07 min
  • 5
    Extendiendo la API de Pandas

    Extendiendo la API de Pandas

    14:03 min
  • 6
    Tabulación de valores faltantes

    Tabulación de valores faltantes

    16:58 min
  • 7
    Visualización de valores faltantes

    Visualización de valores faltantes

    12:04 min

Manipulación inicial de valores faltantes

  • 8
    Codificación de valores faltantes

    Codificación de valores faltantes

    13:10 min
  • 9
    Conversión de valores faltantes implícitos en explícitos

    Conversión de valores faltantes implícitos en explícitos

    08:57 min
  • 10
    Exponer filas faltantes implícitas en explícitas

    Exponer filas faltantes implícitas en explícitas

    07:59 min
  • 11
    Tipos de valores faltantes

    Tipos de valores faltantes

    05:51 min
  • 12
    MCAR, MAR, MNAR en Python

    MCAR, MAR, MNAR en Python

    08:51 min

Búsqueda de relaciones de valores faltantes

  • 13
    Matriz de sombras: shadow matrix

    Matriz de sombras: shadow matrix

    14:34 min
  • 14
    Visualización de valores faltantes en una variable

    Visualización de valores faltantes en una variable

    10:06 min
  • 15
    Visualización de valores faltantes en dos variables

    Visualización de valores faltantes en dos variables

    10:00 min
  • 16
    Scatterplot con valores faltantes

    Scatterplot con valores faltantes

    09:42 min
  • 17
    Correlación de nulidad

    Correlación de nulidad

    07:00 min

Tratamiento de valores faltantes

  • 18
    Eliminación de valores faltantes: pairwise y listwise

    Eliminación de valores faltantes: pairwise y listwise

    14:28 min
  • 19
    Imputación básica de datos

    Imputación básica de datos

    10:53 min
  • 20
    Bonus: visualización múltiple de imputaciones

    Bonus: visualización múltiple de imputaciones

    Viendo ahora

Cierre de curso

  • 21
    Continúa aprendiendo sobre el manejo de valores faltantes

    Continúa aprendiendo sobre el manejo de valores faltantes

    03:21 min
Tomar examen

Escuelas

  • Desarrollo Web
    • Fundamentos del Desarrollo Web Profesional
    • Diseño y Desarrollo Frontend
    • Desarrollo Frontend con JavaScript
    • Desarrollo Frontend con Vue.js
    • Desarrollo Frontend con Angular
    • Desarrollo Frontend con React.js
    • Desarrollo Backend con Node.js
    • Desarrollo Backend con Python
    • Desarrollo Backend con Java
    • Desarrollo Backend con PHP
    • Desarrollo Backend con Ruby
    • Bases de Datos para Web
    • Seguridad Web & API
    • Testing Automatizado y QA para Web
    • Arquitecturas Web Modernas y Escalabilidad
    • DevOps y Cloud para Desarrolladores Web
  • English Academy
    • Inglés Básico A1
    • Inglés Básico A2
    • Inglés Intermedio B1
    • Inglés Intermedio Alto B2
    • Inglés Avanzado C1
    • Inglés para Propósitos Específicos
    • Inglés de Negocios
  • Marketing Digital
    • Fundamentos de Marketing Digital
    • Marketing de Contenidos y Redacción Persuasiva
    • SEO y Posicionamiento Web
    • Social Media Marketing y Community Management
    • Publicidad Digital y Paid Media
    • Analítica Digital y Optimización (CRO)
    • Estrategia de Marketing y Growth
    • Marketing de Marca y Comunicación Estratégica
    • Marketing para E-commerce
    • Marketing B2B
    • Inteligencia Artificial Aplicada al Marketing
    • Automatización del Marketing
    • Marca Personal y Marketing Freelance
    • Ventas y Experiencia del Cliente
    • Creación de Contenido para Redes Sociales
  • Inteligencia Artificial y Data Science
    • Fundamentos de Data Science y AI
    • Análisis y Visualización de Datos
    • Machine Learning y Deep Learning
    • Data Engineer
    • Inteligencia Artificial para la Productividad
    • Desarrollo de Aplicaciones con IA
    • AI Software Engineer
  • Ciberseguridad
    • Fundamentos de Ciberseguridad
    • Hacking Ético y Pentesting (Red Team)
    • Análisis de Malware e Ingeniería Forense
    • Seguridad Defensiva y Cumplimiento (Blue Team)
    • Ciberseguridad Estratégica
  • Liderazgo y Habilidades Blandas
    • Fundamentos de Habilidades Profesionales
    • Liderazgo y Gestión de Equipos
    • Comunicación Avanzada y Oratoria
    • Negociación y Resolución de Conflictos
    • Inteligencia Emocional y Autogestión
    • Productividad y Herramientas Digitales
    • Gestión de Proyectos y Metodologías Ágiles
    • Desarrollo de Carrera y Marca Personal
    • Diversidad, Inclusión y Entorno Laboral Saludable
    • Filosofía y Estrategia para Líderes
  • Diseño de Producto y UX
    • Fundamentos de Diseño UX/UI
    • Investigación de Usuarios (UX Research)
    • Arquitectura de Información y Usabilidad
    • Diseño de Interfaces y Prototipado (UI Design)
    • Sistemas de Diseño y DesignOps
    • Redacción UX (UX Writing)
    • Creatividad e Innovación en Diseño
    • Diseño Accesible e Inclusivo
    • Diseño Asistido por Inteligencia Artificial
    • Gestión de Producto y Liderazgo en Diseño
    • Diseño de Interacciones Emergentes (VUI/VR)
    • Desarrollo Web para Diseñadores
    • Diseño y Prototipado No-Code
  • Contenido Audiovisual
    • Fundamentos de Producción Audiovisual
    • Producción de Video para Plataformas Digitales
    • Producción de Audio y Podcast
    • Fotografía y Diseño Gráfico para Contenido Digital
    • Motion Graphics y Animación
    • Contenido Interactivo y Realidad Aumentada
    • Estrategia, Marketing y Monetización de Contenidos
  • Desarrollo Móvil
    • Fundamentos de Desarrollo Móvil
    • Desarrollo Nativo Android con Kotlin
    • Desarrollo Nativo iOS con Swift
    • Desarrollo Multiplataforma con React Native
    • Desarrollo Multiplataforma con Flutter
    • Arquitectura y Patrones de Diseño Móvil
    • Integración de APIs y Persistencia Móvil
    • Testing y Despliegue en Móvil
    • Diseño UX/UI para Móviles
  • Diseño Gráfico y Arte Digital
    • Fundamentos del Diseño Gráfico y Digital
    • Diseño de Identidad Visual y Branding
    • Ilustración Digital y Arte Conceptual
    • Diseño Editorial y de Empaques
    • Motion Graphics y Animación 3D
    • Diseño Gráfico Asistido por Inteligencia Artificial
    • Creatividad e Innovación en Diseño
  • Programación
    • Fundamentos de Programación e Ingeniería de Software
    • Herramientas de IA para el trabajo
    • Matemáticas para Programación
    • Programación con Python
    • Programación con JavaScript
    • Programación con TypeScript
    • Programación Orientada a Objetos con Java
    • Desarrollo con C# y .NET
    • Programación con PHP
    • Programación con Go y Rust
    • Programación Móvil con Swift y Kotlin
    • Programación con C y C++
    • Administración Básica de Servidores Linux
  • Negocios
    • Fundamentos de Negocios y Emprendimiento
    • Estrategia y Crecimiento Empresarial
    • Finanzas Personales y Corporativas
    • Inversión en Mercados Financieros
    • Ventas, CRM y Experiencia del Cliente
    • Operaciones, Logística y E-commerce
    • Gestión de Proyectos y Metodologías Ágiles
    • Aspectos Legales y Cumplimiento
    • Habilidades Directivas y Crecimiento Profesional
    • Diversidad e Inclusión en el Entorno Laboral
    • Herramientas Digitales y Automatización para Negocios
  • Blockchain y Web3
    • Fundamentos de Blockchain y Web3
    • Desarrollo de Smart Contracts y dApps
    • Finanzas Descentralizadas (DeFi)
    • NFTs y Economía de Creadores
    • Seguridad Blockchain
    • Ecosistemas Blockchain Alternativos (No-EVM)
    • Producto, Marketing y Legal en Web3
  • Recursos Humanos
    • Fundamentos y Cultura Organizacional en RRHH
    • Atracción y Selección de Talento
    • Cultura y Employee Experience
    • Gestión y Desarrollo de Talento
    • Desarrollo y Evaluación de Liderazgo
    • Diversidad, Equidad e Inclusión
    • AI y Automatización en Recursos Humanos
    • Tecnología y Automatización en RRHH
  • Finanzas e Inversiones
    • Fundamentos de Finanzas Personales y Corporativas
    • Análisis y Valoración Financiera
    • Inversión y Mercados de Capitales
    • Finanzas Descentralizadas (DeFi) y Criptoactivos
    • Finanzas y Estrategia para Startups
    • Inteligencia Artificial Aplicada a Finanzas
    • Domina Excel
    • Financial Analyst
    • Conseguir trabajo en Finanzas e Inversiones
  • Startups
    • Fundamentos y Validación de Ideas
    • Estrategia de Negocio y Product-Market Fit
    • Desarrollo de Producto y Operaciones Lean
    • Finanzas, Legal y Fundraising
    • Marketing, Ventas y Growth para Startups
    • Cultura, Talento y Liderazgo
    • Finanzas y Operaciones en Ecommerce
    • Startups Web3 y Blockchain
    • Startups con Impacto Social
    • Expansión y Ecosistema Startup
  • Cloud Computing y DevOps
    • Fundamentos de Cloud y DevOps
    • Administración de Servidores Linux
    • Contenerización y Orquestación
    • Infraestructura como Código (IaC) y CI/CD
    • Amazon Web Services
    • Microsoft Azure
    • Serverless y Observabilidad
    • Certificaciones Cloud (Preparación)
    • Plataforma Cloud GCP

Platzi y comunidad

  • Platzi Business
  • Live Classes
  • Lanzamientos
  • Executive Program
  • Trabaja con nosotros
  • Podcast

Recursos

  • Manual de Marca

Soporte

  • Preguntas Frecuentes
  • Contáctanos

Legal

  • Términos y Condiciones
  • Privacidad
  • Tyc promociones
Reconocimientos
Reconocimientos
Logo reconocimientoTop 40 Mejores EdTech del mundo · 2024
Logo reconocimientoPrimera Startup Latina admitida en YC · 2014
Logo reconocimientoPrimera Startup EdTech · 2018
Logo reconocimientoCEO Ganador Medalla por la Educación T4 & HP · 2024
Logo reconocimientoCEO Mejor Emprendedor del año · 2024
De LATAM conpara el mundo
YoutubeInstagramLinkedInTikTokFacebookX (Twitter)Threads
        Carlos Mazzaroli

        Carlos Mazzaroli

        student•
        hace 3 años

        Misma pregunta que unas clases anteriores, esto tambien podria pasarlo a un archivo dentro de utils?

          Alfonso Andres Zapata Guzman

          Alfonso Andres Zapata Guzman

          student•
          hace 3 años

          Que o quien te detiene? trabaja como te sientas mas cómodo.

          Carlos Mazzaroli

          Carlos Mazzaroli

          student•
          hace 3 años

          La pregunta es si el archivo debería ir en una carpeta utils, o en otra carpeta que sea para este tipo de extensiones

        José Rodrigo Arana Hi

        José Rodrigo Arana Hi

        student•
        hace 3 años

        Truchas porque en el 1er gráfico no sale cuántos valores fueron imputados. Curiosamente, si quitas el parámetro common_bins hace que aparezcan. Le estuve intentando si pudiera arreglarlo pero no, a ver si alguien puede hacerlo en el futuro.

          Pablo Alejandro Figueroa

          Pablo Alejandro Figueroa

          student•
          hace 2 años
          Captura de pantalla 2024-01-28 223041.png
        Mario Alexander Vargas Celis

        Mario Alexander Vargas Celis

        student•
        hace 2 años

        La visualización de múltiples imputaciones te permite comparar cómo diferentes técnicas de imputación afectan los datos faltantes. Esto es útil para evaluar el impacto de las imputaciones y decidir cuál es la más adecuada para el análisis. A continuación, veremos cómo hacer esto utilizando **matplotlib**, **seaborn**, y varias técnicas de imputación en **pandas**.

        ### Pasos para visualizar múltiples imputaciones:

        1. **Crear un conjunto de datos con valores faltantes.**

        2. **Imputar los valores faltantes utilizando diferentes métodos.**

        3. **Visualizar las imputaciones en gráficos para comparar los resultados.**

        ### Ejemplo en Python:

        #### 1. Crear el conjunto de datos

        import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns \# Crear un DataFrame de ejemplo con valores faltantes np.random.seed(0) data = {'Variable1': \[1, np.nan, 3, np.nan, 5, 6, np.nan, 8, 9, 10],   'Variable2': \[7, 6, np.nan, 4, 3, 2, np.nan, 5, 6, np.nan]} df = pd.DataFrame(data) print("Datos originales con valores faltantes:") print(df)

        #### 2. Aplicar múltiples métodos de imputación

        \# Imputación con la media df\_mean = df.copy() df\_mean\['Variable1'] = df\['Variable1'].fillna(df\['Variable1'].mean()) df\_mean\['Variable2'] = df\['Variable2'].fillna(df\['Variable2'].mean()) \# Imputación con la mediana df\_median = df.copy() df\_median\['Variable1'] = df\['Variable1'].fillna(df\['Variable1'].median()) df\_median\['Variable2'] = df\['Variable2'].fillna(df\['Variable2'].median()) \# Imputación hacia adelante (forward fill) df\_ffill = df.copy() df\_ffill.fillna(method='ffill', inplace=True) \# Imputación hacia atrás (backward fill) df\_bfill = df.copy() df\_bfill.fillna(method='bfill', inplace=True)

        #### 3. Visualizar las imputaciones

        Vamos a graficar cada imputación y compararlas.

        \# Configurar las subplots fig, axes = plt.subplots(2, 2, figsize=(12, 10)) \# Datos originales sns.scatterplot(ax=axes\[0, 0], x=np.arange(len(df)), y=df\['Variable1'], label='Variable1', color='blue') sns.scatterplot(ax=axes\[0, 0], x=np.arange(len(df)), y=df\['Variable2'], label='Variable2', color='red') axes\[0, 0].set\_title("Datos Originales") \# Imputación con la media sns.scatterplot(ax=axes\[0, 1], x=np.arange(len(df\_mean)), y=df\_mean\['Variable1'], label='Variable1', color='blue') sns.scatterplot(ax=axes\[0, 1], x=np.arange(len(df\_mean)), y=df\_mean\['Variable2'], label='Variable2', color='red') axes\[0, 1].set\_title("Imputación con la Media") \# Imputación hacia adelante sns.scatterplot(ax=axes\[1, 0], x=np.arange(len(df\_ffill)), y=df\_ffill\['Variable1'], label='Variable1', color='blue') sns.scatterplot(ax=axes\[1, 0], x=np.arange(len(df\_ffill)), y=df\_ffill\['Variable2'], label='Variable2', color='red') axes\[1, 0].set\_title("Imputación Hacia Adelante (Forward Fill)") \# Imputación hacia atrás sns.scatterplot(ax=axes\[1, 1], x=np.arange(len(df\_bfill)), y=df\_bfill\['Variable1'], label='Variable1', color='blue') sns.scatterplot(ax=axes\[1, 1], x=np.arange(len(df\_bfill)), y=df\_bfill\['Variable2'], label='Variable2', color='red') axes\[1, 1].set\_title("Imputación Hacia Atrás (Backward Fill)") plt.tight\_layout() plt.show()

        ### Explicación:

        - **Subplot 1**: Muestra los datos originales con los valores faltantes.

        - **Subplot 2**: Muestra los datos imputados con la **media**.

        - **Subplot 3**: Visualiza los datos con imputación **forward fill**.

        - **Subplot 4**: Presenta la imputación con **backward fill**.

        Cada gráfico te permite comparar los métodos y cómo afectan los valores imputados. Esto te ayuda a evaluar cuál técnica es la más adecuada para tu análisis.

        Yeison Luna

        Yeison Luna

        student•
        hace 3 años

        Código de visualización múltiple de imputaciones

        ( riskfactors_df .select_columns("weight_lbs","height_inch","bmi") .missing.bind_shadow_matrix(true_string=True,false_string=False) .apply( axis="rows", func = lambda column : column.fillna(column.mean()) if "_NA" not in column.name else column ) .pivot_longer( index="*_NA" ) .pivot_longer( index=["variable","value"], names_to="variable_NA", values_to="value_NA" ) .assign( valid=lambda df : df.apply(axis="columns", func= lambda column : column.variable in column.variable_NA) ) .query("valid") .pipe( lambda df:( sns.displot( data=df, x="value", hue="value_NA", col="variable", common_bins=False, facet_kws={ "sharex":False, "sharey":False } ) ) ) )