CursosEmpresasBlogLiveConfPrecios

Conversión de valores faltantes implícitos en explícitos

Clase 9 de 21 • Curso de Manejo de Datos Faltantes: Detección y Exploración

Clase anteriorSiguiente clase

Contenido del curso

Introducción a los valores faltantes

  • 1
    ¿Por qué explorar y lidiar con valores faltantes?

    ¿Por qué explorar y lidiar con valores faltantes?

    06:59 min
  • 2
    Operaciones con valores faltantes

    Operaciones con valores faltantes

    13:52 min
  • 3
    Conociendo datasets para manejo de datos faltantes

    Conociendo datasets para manejo de datos faltantes

    09:01 min
  • 4

    Ejecución de Notebooks en Deepnote con %run

    01:07 min
  • 5
    Extendiendo la API de Pandas

    Extendiendo la API de Pandas

    14:03 min
  • 6
    Tabulación de valores faltantes

    Tabulación de valores faltantes

    16:58 min
  • 7
    Visualización de valores faltantes

    Visualización de valores faltantes

    12:04 min

Manipulación inicial de valores faltantes

  • 8
    Codificación de valores faltantes

    Codificación de valores faltantes

    13:10 min
  • 9
    Conversión de valores faltantes implícitos en explícitos

    Conversión de valores faltantes implícitos en explícitos

    Viendo ahora
  • 10
    Exponer filas faltantes implícitas en explícitas

    Exponer filas faltantes implícitas en explícitas

    07:59 min
  • 11
    Tipos de valores faltantes

    Tipos de valores faltantes

    05:51 min
  • 12
    MCAR, MAR, MNAR en Python

    MCAR, MAR, MNAR en Python

    08:51 min

Búsqueda de relaciones de valores faltantes

  • 13
    Matriz de sombras: shadow matrix

    Matriz de sombras: shadow matrix

    14:34 min
  • 14
    Visualización de valores faltantes en una variable

    Visualización de valores faltantes en una variable

    10:06 min
  • 15
    Visualización de valores faltantes en dos variables

    Visualización de valores faltantes en dos variables

    10:00 min
  • 16
    Scatterplot con valores faltantes

    Scatterplot con valores faltantes

    09:42 min
  • 17
    Correlación de nulidad

    Correlación de nulidad

    07:00 min

Tratamiento de valores faltantes

  • 18
    Eliminación de valores faltantes: pairwise y listwise

    Eliminación de valores faltantes: pairwise y listwise

    14:28 min
  • 19
    Imputación básica de datos

    Imputación básica de datos

    10:53 min
  • 20
    Bonus: visualización múltiple de imputaciones

    Bonus: visualización múltiple de imputaciones

    07:50 min

Cierre de curso

  • 21
    Continúa aprendiendo sobre el manejo de valores faltantes

    Continúa aprendiendo sobre el manejo de valores faltantes

    03:21 min
  • Tomar el examen del curso
    • Jeinfferson Bernal G

      Jeinfferson Bernal G

      student•
      hace 3 años

      Estrategia para la identificacion de valores faltantes implicitos

      • Pivotar la tabla de datos. Pivotar es tomar una columna de referencia sobre la cual se quiere extender sus categorias de manera que muestre una nueva visualizacion de los datos
      ( implicit_to_explicit_df .pivot_wider( index="name", # variable nombre como filas names_from="time", # variable time como columnas values_from="value" # variable value como valores de la tabla ) )
      graph16.jpg
      • Cuantificar ocurrencias de N-tuplas
      ( implicit_to_explicit_df .value_counts( subset=["name"] # cuenta los valores asociados a los nombres ) .reset_index(name="n") # asigna n como indice del conteo .query("n < 3") # condicion a cumplir por n para que se muestre en la tabla )
      graph17.jpg
      Nixon Rolando García Ramírez

      Nixon Rolando García Ramírez

      student•
      hace 3 años

      Algo curioso es que por mi parte no encontre la funcion .

      pivot_wider

      Pero la que si enocontre fue la sieguiente, donde lo unico que cambia es que el campo names_from se llama colums y el campo values_from se llama values.

      pd.pivot(data = implicit_to_explicit_df, index="name", # variable nombre como filas columns="time", # variable time como columnas values="value" # variable value como valores de la tabla )
        Nestor Colmenarez

        Nestor Colmenarez

        student•
        hace 2 años

        la verdad tampoco me aperecio ese metodo....

        Alberto Duque Villegas

        Alberto Duque Villegas

        student•
        hace 2 años

        Gracias por tu solución.

        Añado una Solución de ChatGPT:

        pivoted_df = implicit_to_explicit_df.pivot(index="name", columns="time", values="value")

        Que ejecuta la siguiente salida:

        pivoted_df
        Captura2.JPG
      Jeinfferson Bernal G

      Jeinfferson Bernal G

      student•
      hace 3 años

      "Implícito se refiere a todo aquello que se entiende que está incluido pero sin ser expresado de forma directa o explícitamente."

      Un valor faltante implícito indica que el valor faltante debería estar incluido en el conjunto de datos del análisis, sin que éste lo diga o lo especifique. Por lo general, son valores que podemos encontrar al pivotar nuestros datos o contabilizar el número de apariciones de combinaciones de las variables de estudio.

      Nixon Rolando García Ramírez

      Nixon Rolando García Ramírez

      student•
      hace 3 años

      Esta clase me dejo viendo el mundo de otra forma jajajaja

      Jose Luis Quintero Sánchez

      Jose Luis Quintero Sánchez

      student•
      hace 3 años

      Dataframe de valores implícitos:

      implicit_to_explicit_df = pd.DataFrame.from_dict( data={ "name": ["lynn", "lynn", "lynn", "zelda"], "time": ["morning", "afternoon", "night", "morning"], "value": [350, 310, np.nan, 320] } ) implicit_to_explicit_df
        Pablo Alejandro Figueroa

        Pablo Alejandro Figueroa

        student•
        hace 2 años

        gracias.:!

      Naren Fragozo

      Naren Fragozo

      student•
      hace 3 años

      📢 Explícito y implícito

      • "Explícito" es algo que se dice o se muestra de manera clara y directa, sin dejar lugar a dudas. Es decir, es algo que se expresa abiertamente y sin rodeos.
      • Por otro lado, "implícito" se refiere a algo que no se dice o se muestra de forma directa, sino que se da a entender de manera indirecta o sugerida. Es decir, es algo que no está explícitamente expresado, pero se puede deducir o inferir a partir de lo que se dice o se muestra.

      Por ejemplo

      Si te digo "tengo hambre, ¿quieres ir a comer algo conmigo?", la invitación a comer algo es explícita, ya que se dice de manera directa. Pero si te digo "tengo hambre, qué bien huele ese restaurante", la invitación no está expresada de forma directa, pero se puede entender implícitamente que te estoy invitando a comer en ese restaurante.

      Rubén Téllez Gerardo

      Rubén Téllez Gerardo

      student•
      hace un año

      Con seguridad en algún momento necesitarán realizar lo contrario a un pivotaje, pues la mayoría de algoritmos requiere la computación explicita de 2 variables. Esto puede hacerse con pd.melt.

      pd.melt( itoe_pivoted.reset_index(), id_vars = ["name"], value_vars = ["afternoon", "morning", "night"] )

      El resultado es el siguiente:

      ANDRES EDUARDO MEDINA FERNANDEZ

      ANDRES EDUARDO MEDINA FERNANDEZ

      student•
      hace 3 años

      Me queda una duda al hacer : ( implicit_to_explicit_df .value_counts( subset= ["name"] ) .reset_index(name="n") .query("n<3") ) Se visualiza los datos que tiene menos de tres ocurrenias, pero si una variable tiene datos faltantes explicitos como lo era lynn, no lo va a mostrar?

        Leandro Tenjo

        Leandro Tenjo

        student•
        hace 3 años

        Lo que queremos es hacer visibles los datos faltantes implícitos para convertirlos en explicito. Después de eso, todos los valores faltantes tendrán el mismo formato y podremos analizarlos tranquilamente.

      Cesar Prada

      Cesar Prada

      student•
      hace 7 meses

      Identificar los valores faltantes es crucial para garantizar la calidad y precisión de tus análisis de datos. Estos valores pueden distorsionar tus conclusiones y, por tanto, es esencial tratarlos adecuadamente. Al identificar patrones en los datos faltantes, puedes optar por eliminar registros incompletos o aplicar técnicas de imputación que estimen los valores. Esto mejora la validez de tus modelos y análisis, lo que es fundamental en áreas como la inteligencia artificial y el análisis de datos.

      Mario Alexander Vargas Celis

      Mario Alexander Vargas Celis

      student•
      hace un año

      La **conversión de valores faltantes implícitos en explícitos** es una técnica para transformar valores "ocultos" o "implícitos" que pueden representar la falta de datos en un formato claro y explícito dentro de un DataFrame. Los valores faltantes implícitos son aquellos que no se encuentran explícitamente como NaN pero representan una ausencia o falta de datos por otras razones, como valores de cero, valores negativos, cadenas vacías, o un valor especial.

      ### Ejemplos comunes de valores faltantes implícitos:

      - **Cadenas vacías** ('')

      - **Valores de 0** en contextos donde el 0 no tiene un significado válido.

      - **Valores negativos** que representan datos faltantes.

      - **Códigos especiales** como -1 o 9999 para indicar que no hay datos.

      ### Proceso para convertir valores faltantes implícitos en explícitos (NaN):

      #### 1. **Convertir cadenas vacías o específicas en NaN:**

      Si tienes cadenas vacías o un valor especial que representa datos faltantes, puedes convertirlos en NaN.

      ```python

      import pandas as pd

      import numpy as np

      # Crear un DataFrame con valores faltantes implícitos

      df = pd.DataFrame({

      'Producto': ['A', '', 'C', 'D', ''],

      'Precio': [100, 0, -1, 150, 200]

      })

      # Convertir cadenas vacías ('') en NaN

      df['Producto'] = df['Producto'].replace('', np.nan)

      print(df)

      ```

      Salida:

      ```

      Producto Precio

      0 A 100

      1 NaN 0

      2 C -1

      3 D 150

      4 NaN 200

      ```

      #### 2. **Convertir valores numéricos especiales en NaN:**

      A veces, ciertos valores numéricos (como 0 o -1) pueden representar valores faltantes implícitos en tu conjunto de datos.

      ```python

      # Convertir valores especiales (0 y -1) en NaN

      df['Precio'] = df['Precio'].replace([0, -1], np.nan)

      print(df)

      ```

      Salida:

      ```

      Producto Precio

      0 A 100.0

      1 NaN NaN

      2 C NaN

      3 D 150.0

      4 NaN 200.0

      ```

      #### 3. **Utilizar condiciones para identificar valores faltantes implícitos:**

      En algunos casos, necesitarás aplicar condiciones para definir cuándo un valor debe considerarse faltante.

      ```python

      # Suponer que los valores menores a 0 son valores faltantes implícitos

      df['Precio'] = df['Precio'].apply(lambda x: np.nan if x < 0 else x)

      print(df)

      ```

      #### 4. **Uso de replace() para convertir múltiples valores en NaN:**

      La función replace() también permite reemplazar varios valores que consideres implícitamente faltantes con NaN.

      ```python

      # Reemplazar valores de -1 y 0 en la columna 'Precio' con NaN

      df['Precio'] = df['Precio'].replace([-1, 0], np.nan)

      print(df)

      ```

      #### 5. **Uso de mask() para crear condiciones complejas:**

      La función mask() permite definir condiciones lógicas más avanzadas para identificar valores faltantes.

      ```python

      # Reemplazar valores mayores a 100 con NaN (ejemplo condicional)

      df['Precio'] = df['Precio'].mask(df['Precio'] > 100)

      print(df)

      ```

      ### Resumen:

      La conversión de valores faltantes implícitos en explícitos permite mejorar la calidad de los datos y facilita el análisis. Hacer explícitos los valores faltantes con NaN facilita el uso de las herramientas de Pandas para manejar valores nulos, como fillna(), dropna(), o cualquier técnica de imputación o filtrado.

      Si tienes un caso más específico, ¡puedo ayudarte con una solución detallada!

      Diego Cesar Lerma Torres

      Diego Cesar Lerma Torres

      student•
      hace 2 años

      Por si les sale el warning:

      FutureWarning: This function will be deprecated in a 1.x release. Please use `pd.DataFrame.pivot` instead. &#x20; return method(self.\_obj, \*args, \*\*kwargs)

      Les paso el código con pivot:

      implicit\_to\_explicit\_df.pivot(index='name', columns='time', values='value').reset\_index()
      Diego Cesar Lerma Torres

      Diego Cesar Lerma Torres

      student•
      hace 2 años

      Por si les da el warning

      FutureWarning: This function will be deprecated in a 1.x release. Please use `pd.DataFrame.pivot` instead. return method(self._obj, *args, **kwargs) ```Les paso el código con pivot ```js implicit_to_explicit_df.pivot(index='name', columns='time', values='value').reset_index()
      Pablo Alejandro Figueroa

      Pablo Alejandro Figueroa

      student•
      hace 2 años

      genial!

      Julián Cárdenas

      Julián Cárdenas

      student•
      hace 3 años

      excelente

      Paolo Joaquin Pinto Perez

      Paolo Joaquin Pinto Perez

      student•
      hace 3 años

      Como pivotar la tabla de datos

      ( implicit_to_explicit_df .pivot_wider( index="name", # mantenerlos como id's de cada fila names_from="time", # valores a crear como col's values_from="value" # quermos rellenarlo y toma los valores de la colunma... ) )

      Cuantificar ocurrencias de n-tuplas

      Ventaja: se puede combinar las variables que quieras( no siempre será una matriz)

    Escuelas

    • Desarrollo Web
      • Fundamentos del Desarrollo Web Profesional
      • Diseño y Desarrollo Frontend
      • Desarrollo Frontend con JavaScript
      • Desarrollo Frontend con Vue.js
      • Desarrollo Frontend con Angular
      • Desarrollo Frontend con React.js
      • Desarrollo Backend con Node.js
      • Desarrollo Backend con Python
      • Desarrollo Backend con Java
      • Desarrollo Backend con PHP
      • Desarrollo Backend con Ruby
      • Bases de Datos para Web
      • Seguridad Web & API
      • Testing Automatizado y QA para Web
      • Arquitecturas Web Modernas y Escalabilidad
      • DevOps y Cloud para Desarrolladores Web
    • English Academy
      • Inglés Básico A1
      • Inglés Básico A2
      • Inglés Intermedio B1
      • Inglés Intermedio Alto B2
      • Inglés Avanzado C1
      • Inglés para Propósitos Específicos
      • Inglés de Negocios
    • Marketing Digital
      • Fundamentos de Marketing Digital
      • Marketing de Contenidos y Redacción Persuasiva
      • SEO y Posicionamiento Web
      • Social Media Marketing y Community Management
      • Publicidad Digital y Paid Media
      • Analítica Digital y Optimización (CRO)
      • Estrategia de Marketing y Growth
      • Marketing de Marca y Comunicación Estratégica
      • Marketing para E-commerce
      • Marketing B2B
      • Inteligencia Artificial Aplicada al Marketing
      • Automatización del Marketing
      • Marca Personal y Marketing Freelance
      • Ventas y Experiencia del Cliente
      • Creación de Contenido para Redes Sociales
    • Inteligencia Artificial y Data Science
      • Fundamentos de Data Science y AI
      • Análisis y Visualización de Datos
      • Machine Learning y Deep Learning
      • Data Engineer
      • Inteligencia Artificial para la Productividad
      • Desarrollo de Aplicaciones con IA
      • AI Software Engineer
    • Ciberseguridad
      • Fundamentos de Ciberseguridad
      • Hacking Ético y Pentesting (Red Team)
      • Análisis de Malware e Ingeniería Forense
      • Seguridad Defensiva y Cumplimiento (Blue Team)
      • Ciberseguridad Estratégica
    • Liderazgo y Habilidades Blandas
      • Fundamentos de Habilidades Profesionales
      • Liderazgo y Gestión de Equipos
      • Comunicación Avanzada y Oratoria
      • Negociación y Resolución de Conflictos
      • Inteligencia Emocional y Autogestión
      • Productividad y Herramientas Digitales
      • Gestión de Proyectos y Metodologías Ágiles
      • Desarrollo de Carrera y Marca Personal
      • Diversidad, Inclusión y Entorno Laboral Saludable
      • Filosofía y Estrategia para Líderes
    • Diseño de Producto y UX
      • Fundamentos de Diseño UX/UI
      • Investigación de Usuarios (UX Research)
      • Arquitectura de Información y Usabilidad
      • Diseño de Interfaces y Prototipado (UI Design)
      • Sistemas de Diseño y DesignOps
      • Redacción UX (UX Writing)
      • Creatividad e Innovación en Diseño
      • Diseño Accesible e Inclusivo
      • Diseño Asistido por Inteligencia Artificial
      • Gestión de Producto y Liderazgo en Diseño
      • Diseño de Interacciones Emergentes (VUI/VR)
      • Desarrollo Web para Diseñadores
      • Diseño y Prototipado No-Code
    • Contenido Audiovisual
      • Fundamentos de Producción Audiovisual
      • Producción de Video para Plataformas Digitales
      • Producción de Audio y Podcast
      • Fotografía y Diseño Gráfico para Contenido Digital
      • Motion Graphics y Animación
      • Contenido Interactivo y Realidad Aumentada
      • Estrategia, Marketing y Monetización de Contenidos
    • Desarrollo Móvil
      • Fundamentos de Desarrollo Móvil
      • Desarrollo Nativo Android con Kotlin
      • Desarrollo Nativo iOS con Swift
      • Desarrollo Multiplataforma con React Native
      • Desarrollo Multiplataforma con Flutter
      • Arquitectura y Patrones de Diseño Móvil
      • Integración de APIs y Persistencia Móvil
      • Testing y Despliegue en Móvil
      • Diseño UX/UI para Móviles
    • Diseño Gráfico y Arte Digital
      • Fundamentos del Diseño Gráfico y Digital
      • Diseño de Identidad Visual y Branding
      • Ilustración Digital y Arte Conceptual
      • Diseño Editorial y de Empaques
      • Motion Graphics y Animación 3D
      • Diseño Gráfico Asistido por Inteligencia Artificial
      • Creatividad e Innovación en Diseño
    • Programación
      • Fundamentos de Programación e Ingeniería de Software
      • Herramientas de IA para el trabajo
      • Matemáticas para Programación
      • Programación con Python
      • Programación con JavaScript
      • Programación con TypeScript
      • Programación Orientada a Objetos con Java
      • Desarrollo con C# y .NET
      • Programación con PHP
      • Programación con Go y Rust
      • Programación Móvil con Swift y Kotlin
      • Programación con C y C++
      • Administración Básica de Servidores Linux
    • Negocios
      • Fundamentos de Negocios y Emprendimiento
      • Estrategia y Crecimiento Empresarial
      • Finanzas Personales y Corporativas
      • Inversión en Mercados Financieros
      • Ventas, CRM y Experiencia del Cliente
      • Operaciones, Logística y E-commerce
      • Gestión de Proyectos y Metodologías Ágiles
      • Aspectos Legales y Cumplimiento
      • Habilidades Directivas y Crecimiento Profesional
      • Diversidad e Inclusión en el Entorno Laboral
      • Herramientas Digitales y Automatización para Negocios
    • Blockchain y Web3
      • Fundamentos de Blockchain y Web3
      • Desarrollo de Smart Contracts y dApps
      • Finanzas Descentralizadas (DeFi)
      • NFTs y Economía de Creadores
      • Seguridad Blockchain
      • Ecosistemas Blockchain Alternativos (No-EVM)
      • Producto, Marketing y Legal en Web3
    • Recursos Humanos
      • Fundamentos y Cultura Organizacional en RRHH
      • Atracción y Selección de Talento
      • Cultura y Employee Experience
      • Gestión y Desarrollo de Talento
      • Desarrollo y Evaluación de Liderazgo
      • Diversidad, Equidad e Inclusión
      • AI y Automatización en Recursos Humanos
      • Tecnología y Automatización en RRHH
    • Finanzas e Inversiones
      • Fundamentos de Finanzas Personales y Corporativas
      • Análisis y Valoración Financiera
      • Inversión y Mercados de Capitales
      • Finanzas Descentralizadas (DeFi) y Criptoactivos
      • Finanzas y Estrategia para Startups
      • Inteligencia Artificial Aplicada a Finanzas
      • Domina Excel
      • Financial Analyst
      • Conseguir trabajo en Finanzas e Inversiones
    • Startups
      • Fundamentos y Validación de Ideas
      • Estrategia de Negocio y Product-Market Fit
      • Desarrollo de Producto y Operaciones Lean
      • Finanzas, Legal y Fundraising
      • Marketing, Ventas y Growth para Startups
      • Cultura, Talento y Liderazgo
      • Finanzas y Operaciones en Ecommerce
      • Startups Web3 y Blockchain
      • Startups con Impacto Social
      • Expansión y Ecosistema Startup
    • Cloud Computing y DevOps
      • Fundamentos de Cloud y DevOps
      • Administración de Servidores Linux
      • Contenerización y Orquestación
      • Infraestructura como Código (IaC) y CI/CD
      • Amazon Web Services
      • Microsoft Azure
      • Serverless y Observabilidad
      • Certificaciones Cloud (Preparación)
      • Plataforma Cloud GCP

    Platzi y comunidad

    • Platzi Business
    • Live Classes
    • Lanzamientos
    • Executive Program
    • Trabaja con nosotros
    • Podcast

    Recursos

    • Manual de Marca

    Soporte

    • Preguntas Frecuentes
    • Contáctanos

    Legal

    • Términos y Condiciones
    • Privacidad
    • Tyc promociones
    Reconocimientos
    Reconocimientos
    Logo reconocimientoTop 40 Mejores EdTech del mundo · 2024
    Logo reconocimientoPrimera Startup Latina admitida en YC · 2014
    Logo reconocimientoPrimera Startup EdTech · 2018
    Logo reconocimientoCEO Ganador Medalla por la Educación T4 & HP · 2024
    Logo reconocimientoCEO Mejor Emprendedor del año · 2024
    De LATAM conpara el mundo
    YoutubeInstagramLinkedInTikTokFacebookX (Twitter)Threads