CursosEmpresasBlogLiveConfPrecios

Conversión de valores faltantes implícitos en explícitos

Clase 9 de 21 • Curso de Manejo de Datos Faltantes: Detección y Exploración

Clase anteriorSiguiente clase

Contenido del curso

Introducción a los valores faltantes
  • 1
    ¿Por qué explorar y lidiar con valores faltantes?

    ¿Por qué explorar y lidiar con valores faltantes?

    06:59
  • 2
    Operaciones con valores faltantes

    Operaciones con valores faltantes

    13:52
  • 3
    Conociendo datasets para manejo de datos faltantes

    Conociendo datasets para manejo de datos faltantes

    09:01
  • 4

    Ejecución de Notebooks en Deepnote con %run

    01:07
  • 5
    Extendiendo la API de Pandas

    Extendiendo la API de Pandas

    14:03
  • 6
    Tabulación de valores faltantes

    Tabulación de valores faltantes

    16:58
  • 7
    Visualización de valores faltantes

    Visualización de valores faltantes

    12:04
Manipulación inicial de valores faltantes
  • 8
    Codificación de valores faltantes

    Codificación de valores faltantes

    13:10
  • 9
    Conversión de valores faltantes implícitos en explícitos

    Conversión de valores faltantes implícitos en explícitos

    08:57
  • 10
    Exponer filas faltantes implícitas en explícitas

    Exponer filas faltantes implícitas en explícitas

    07:59
  • 11
    Tipos de valores faltantes

    Tipos de valores faltantes

    05:51
  • 12
    MCAR, MAR, MNAR en Python

    MCAR, MAR, MNAR en Python

    08:51
Búsqueda de relaciones de valores faltantes
  • 13
    Matriz de sombras: shadow matrix

    Matriz de sombras: shadow matrix

    14:34
  • 14
    Visualización de valores faltantes en una variable

    Visualización de valores faltantes en una variable

    10:06
  • 15
    Visualización de valores faltantes en dos variables

    Visualización de valores faltantes en dos variables

    10:00
  • 16
    Scatterplot con valores faltantes

    Scatterplot con valores faltantes

    09:42
  • 17
    Correlación de nulidad

    Correlación de nulidad

    07:00
Tratamiento de valores faltantes
  • 18
    Eliminación de valores faltantes: pairwise y listwise

    Eliminación de valores faltantes: pairwise y listwise

    14:28
  • 19
    Imputación básica de datos

    Imputación básica de datos

    10:53
  • 20
    Bonus: visualización múltiple de imputaciones

    Bonus: visualización múltiple de imputaciones

    07:50
Cierre de curso
  • 21
    Continúa aprendiendo sobre el manejo de valores faltantes

    Continúa aprendiendo sobre el manejo de valores faltantes

    03:21
    Jeinfferson Bernal G

    Jeinfferson Bernal G

    student•
    hace 3 años

    Estrategia para la identificacion de valores faltantes implicitos

    • Pivotar la tabla de datos. Pivotar es tomar una columna de referencia sobre la cual se quiere extender sus categorias de manera que muestre una nueva visualizacion de los datos
    ( implicit_to_explicit_df .pivot_wider( index="name", # variable nombre como filas names_from="time", # variable time como columnas values_from="value" # variable value como valores de la tabla ) )
    graph16.jpg
    • Cuantificar ocurrencias de N-tuplas
    ( implicit_to_explicit_df .value_counts( subset=["name"] # cuenta los valores asociados a los nombres ) .reset_index(name="n") # asigna n como indice del conteo .query("n < 3") # condicion a cumplir por n para que se muestre en la tabla )
    graph17.jpg
    Nixon Rolando García Ramírez

    Nixon Rolando García Ramírez

    student•
    hace 3 años

    Algo curioso es que por mi parte no encontre la funcion .

    pivot_wider

    Pero la que si enocontre fue la sieguiente, donde lo unico que cambia es que el campo names_from se llama colums y el campo values_from se llama values.

    pd.pivot(data = implicit_to_explicit_df, index="name", # variable nombre como filas columns="time", # variable time como columnas values="value" # variable value como valores de la tabla )
      Nestor Colmenarez

      Nestor Colmenarez

      student•
      hace 2 años

      la verdad tampoco me aperecio ese metodo....

      Alberto Duque Villegas

      Alberto Duque Villegas

      student•
      hace 2 años

      Gracias por tu solución.

      Añado una Solución de ChatGPT:

      pivoted_df = implicit_to_explicit_df.pivot(index="name", columns="time", values="value")

      Que ejecuta la siguiente salida:

      pivoted_df
      Captura2.JPG
    Jeinfferson Bernal G

    Jeinfferson Bernal G

    student•
    hace 3 años

    "Implícito se refiere a todo aquello que se entiende que está incluido pero sin ser expresado de forma directa o explícitamente."

    Un valor faltante implícito indica que el valor faltante debería estar incluido en el conjunto de datos del análisis, sin que éste lo diga o lo especifique. Por lo general, son valores que podemos encontrar al pivotar nuestros datos o contabilizar el número de apariciones de combinaciones de las variables de estudio.

    Nixon Rolando García Ramírez

    Nixon Rolando García Ramírez

    student•
    hace 3 años

    Esta clase me dejo viendo el mundo de otra forma jajajaja

    Jose Luis Quintero Sánchez

    Jose Luis Quintero Sánchez

    student•
    hace 3 años

    Dataframe de valores implícitos:

    implicit_to_explicit_df = pd.DataFrame.from_dict( data={ "name": ["lynn", "lynn", "lynn", "zelda"], "time": ["morning", "afternoon", "night", "morning"], "value": [350, 310, np.nan, 320] } ) implicit_to_explicit_df
      Pablo Alejandro Figueroa

      Pablo Alejandro Figueroa

      student•
      hace 2 años

      gracias.:!

    Naren Fragozo

    Naren Fragozo

    student•
    hace 3 años

    📢 Explícito y implícito

    • "Explícito" es algo que se dice o se muestra de manera clara y directa, sin dejar lugar a dudas. Es decir, es algo que se expresa abiertamente y sin rodeos.
    • Por otro lado, "implícito" se refiere a algo que no se dice o se muestra de forma directa, sino que se da a entender de manera indirecta o sugerida. Es decir, es algo que no está explícitamente expresado, pero se puede deducir o inferir a partir de lo que se dice o se muestra.

    Por ejemplo

    Si te digo "tengo hambre, ¿quieres ir a comer algo conmigo?", la invitación a comer algo es explícita, ya que se dice de manera directa. Pero si te digo "tengo hambre, qué bien huele ese restaurante", la invitación no está expresada de forma directa, pero se puede entender implícitamente que te estoy invitando a comer en ese restaurante.

    Rubén Téllez Gerardo

    Rubén Téllez Gerardo

    student•
    hace un año

    Con seguridad en algún momento necesitarán realizar lo contrario a un pivotaje, pues la mayoría de algoritmos requiere la computación explicita de 2 variables. Esto puede hacerse con pd.melt.

    pd.melt( itoe_pivoted.reset_index(), id_vars = ["name"], value_vars = ["afternoon", "morning", "night"] )

    El resultado es el siguiente:

    ANDRES EDUARDO MEDINA FERNANDEZ

    ANDRES EDUARDO MEDINA FERNANDEZ

    student•
    hace 2 años

    Me queda una duda al hacer : ( implicit_to_explicit_df .value_counts( subset= ["name"] ) .reset_index(name="n") .query("n<3") ) Se visualiza los datos que tiene menos de tres ocurrenias, pero si una variable tiene datos faltantes explicitos como lo era lynn, no lo va a mostrar?

      Leandro Tenjo

      Leandro Tenjo

      student•
      hace 2 años

      Lo que queremos es hacer visibles los datos faltantes implícitos para convertirlos en explicito. Después de eso, todos los valores faltantes tendrán el mismo formato y podremos analizarlos tranquilamente.

    Cesar Prada

    Cesar Prada

    student•
    hace 6 meses

    Identificar los valores faltantes es crucial para garantizar la calidad y precisión de tus análisis de datos. Estos valores pueden distorsionar tus conclusiones y, por tanto, es esencial tratarlos adecuadamente. Al identificar patrones en los datos faltantes, puedes optar por eliminar registros incompletos o aplicar técnicas de imputación que estimen los valores. Esto mejora la validez de tus modelos y análisis, lo que es fundamental en áreas como la inteligencia artificial y el análisis de datos.

    Mario Alexander Vargas Celis

    Mario Alexander Vargas Celis

    student•
    hace un año

    La **conversión de valores faltantes implícitos en explícitos** es una técnica para transformar valores "ocultos" o "implícitos" que pueden representar la falta de datos en un formato claro y explícito dentro de un DataFrame. Los valores faltantes implícitos son aquellos que no se encuentran explícitamente como NaN pero representan una ausencia o falta de datos por otras razones, como valores de cero, valores negativos, cadenas vacías, o un valor especial.

    ### Ejemplos comunes de valores faltantes implícitos:

    - **Cadenas vacías** ('')

    - **Valores de 0** en contextos donde el 0 no tiene un significado válido.

    - **Valores negativos** que representan datos faltantes.

    - **Códigos especiales** como -1 o 9999 para indicar que no hay datos.

    ### Proceso para convertir valores faltantes implícitos en explícitos (NaN):

    #### 1. **Convertir cadenas vacías o específicas en NaN:**

    Si tienes cadenas vacías o un valor especial que representa datos faltantes, puedes convertirlos en NaN.

    ```python

    import pandas as pd

    import numpy as np

    # Crear un DataFrame con valores faltantes implícitos

    df = pd.DataFrame({

    'Producto': ['A', '', 'C', 'D', ''],

    'Precio': [100, 0, -1, 150, 200]

    })

    # Convertir cadenas vacías ('') en NaN

    df['Producto'] = df['Producto'].replace('', np.nan)

    print(df)

    ```

    Salida:

    ```

    Producto Precio

    0 A 100

    1 NaN 0

    2 C -1

    3 D 150

    4 NaN 200

    ```

    #### 2. **Convertir valores numéricos especiales en NaN:**

    A veces, ciertos valores numéricos (como 0 o -1) pueden representar valores faltantes implícitos en tu conjunto de datos.

    ```python

    # Convertir valores especiales (0 y -1) en NaN

    df['Precio'] = df['Precio'].replace([0, -1], np.nan)

    print(df)

    ```

    Salida:

    ```

    Producto Precio

    0 A 100.0

    1 NaN NaN

    2 C NaN

    3 D 150.0

    4 NaN 200.0

    ```

    #### 3. **Utilizar condiciones para identificar valores faltantes implícitos:**

    En algunos casos, necesitarás aplicar condiciones para definir cuándo un valor debe considerarse faltante.

    ```python

    # Suponer que los valores menores a 0 son valores faltantes implícitos

    df['Precio'] = df['Precio'].apply(lambda x: np.nan if x < 0 else x)

    print(df)

    ```

    #### 4. **Uso de replace() para convertir múltiples valores en NaN:**

    La función replace() también permite reemplazar varios valores que consideres implícitamente faltantes con NaN.

    ```python

    # Reemplazar valores de -1 y 0 en la columna 'Precio' con NaN

    df['Precio'] = df['Precio'].replace([-1, 0], np.nan)

    print(df)

    ```

    #### 5. **Uso de mask() para crear condiciones complejas:**

    La función mask() permite definir condiciones lógicas más avanzadas para identificar valores faltantes.

    ```python

    # Reemplazar valores mayores a 100 con NaN (ejemplo condicional)

    df['Precio'] = df['Precio'].mask(df['Precio'] > 100)

    print(df)

    ```

    ### Resumen:

    La conversión de valores faltantes implícitos en explícitos permite mejorar la calidad de los datos y facilita el análisis. Hacer explícitos los valores faltantes con NaN facilita el uso de las herramientas de Pandas para manejar valores nulos, como fillna(), dropna(), o cualquier técnica de imputación o filtrado.

    Si tienes un caso más específico, ¡puedo ayudarte con una solución detallada!

    Diego Cesar Lerma Torres

    Diego Cesar Lerma Torres

    student•
    hace 2 años

    Por si les sale el warning:

    FutureWarning: This function will be deprecated in a 1.x release. Please use `pd.DataFrame.pivot` instead. &#x20; return method(self.\_obj, \*args, \*\*kwargs)

    Les paso el código con pivot:

    implicit\_to\_explicit\_df.pivot(index='name', columns='time', values='value').reset\_index()
    Diego Cesar Lerma Torres

    Diego Cesar Lerma Torres

    student•
    hace 2 años

    Por si les da el warning

    FutureWarning: This function will be deprecated in a 1.x release. Please use `pd.DataFrame.pivot` instead. return method(self._obj, *args, **kwargs) ```Les paso el código con pivot ```js implicit_to_explicit_df.pivot(index='name', columns='time', values='value').reset_index()
    Pablo Alejandro Figueroa

    Pablo Alejandro Figueroa

    student•
    hace 2 años

    genial!

    Julián Cárdenas

    Julián Cárdenas

    student•
    hace 2 años

    excelente

    Paolo Joaquin Pinto Perez

    Paolo Joaquin Pinto Perez

    student•
    hace 3 años

    Como pivotar la tabla de datos

    ( implicit_to_explicit_df .pivot_wider( index="name", # mantenerlos como id's de cada fila names_from="time", # valores a crear como col's values_from="value" # quermos rellenarlo y toma los valores de la colunma... ) )

    Cuantificar ocurrencias de n-tuplas

    Ventaja: se puede combinar las variables que quieras( no siempre será una matriz)

Escuelas

  • Desarrollo Web
    • Fundamentos del Desarrollo Web Profesional
    • Diseño y Desarrollo Frontend
    • Desarrollo Frontend con JavaScript
    • Desarrollo Frontend con Vue.js
    • Desarrollo Frontend con Angular
    • Desarrollo Frontend con React.js
    • Desarrollo Backend con Node.js
    • Desarrollo Backend con Python
    • Desarrollo Backend con Java
    • Desarrollo Backend con PHP
    • Desarrollo Backend con Ruby
    • Bases de Datos para Web
    • Seguridad Web & API
    • Testing Automatizado y QA para Web
    • Arquitecturas Web Modernas y Escalabilidad
    • DevOps y Cloud para Desarrolladores Web
  • English Academy
    • Inglés Básico A1
    • Inglés Básico A2
    • Inglés Intermedio B1
    • Inglés Intermedio Alto B2
    • Inglés Avanzado C1
    • Inglés para Propósitos Específicos
    • Inglés de Negocios
  • Marketing Digital
    • Fundamentos de Marketing Digital
    • Marketing de Contenidos y Redacción Persuasiva
    • SEO y Posicionamiento Web
    • Social Media Marketing y Community Management
    • Publicidad Digital y Paid Media
    • Analítica Digital y Optimización (CRO)
    • Estrategia de Marketing y Growth
    • Marketing de Marca y Comunicación Estratégica
    • Marketing para E-commerce
    • Marketing B2B
    • Inteligencia Artificial Aplicada al Marketing
    • Automatización del Marketing
    • Marca Personal y Marketing Freelance
    • Ventas y Experiencia del Cliente
    • Creación de Contenido para Redes Sociales
  • Inteligencia Artificial y Data Science
    • Fundamentos de Data Science y AI
    • Análisis y Visualización de Datos
    • Machine Learning y Deep Learning
    • Data Engineer
    • Inteligencia Artificial para la Productividad
    • Desarrollo de Aplicaciones con IA
    • AI Software Engineer
  • Ciberseguridad
    • Fundamentos de Ciberseguridad
    • Hacking Ético y Pentesting (Red Team)
    • Análisis de Malware e Ingeniería Forense
    • Seguridad Defensiva y Cumplimiento (Blue Team)
    • Ciberseguridad Estratégica
  • Liderazgo y Habilidades Blandas
    • Fundamentos de Habilidades Profesionales
    • Liderazgo y Gestión de Equipos
    • Comunicación Avanzada y Oratoria
    • Negociación y Resolución de Conflictos
    • Inteligencia Emocional y Autogestión
    • Productividad y Herramientas Digitales
    • Gestión de Proyectos y Metodologías Ágiles
    • Desarrollo de Carrera y Marca Personal
    • Diversidad, Inclusión y Entorno Laboral Saludable
    • Filosofía y Estrategia para Líderes
  • Diseño de Producto y UX
    • Fundamentos de Diseño UX/UI
    • Investigación de Usuarios (UX Research)
    • Arquitectura de Información y Usabilidad
    • Diseño de Interfaces y Prototipado (UI Design)
    • Sistemas de Diseño y DesignOps
    • Redacción UX (UX Writing)
    • Creatividad e Innovación en Diseño
    • Diseño Accesible e Inclusivo
    • Diseño Asistido por Inteligencia Artificial
    • Gestión de Producto y Liderazgo en Diseño
    • Diseño de Interacciones Emergentes (VUI/VR)
    • Desarrollo Web para Diseñadores
    • Diseño y Prototipado No-Code
  • Contenido Audiovisual
    • Fundamentos de Producción Audiovisual
    • Producción de Video para Plataformas Digitales
    • Producción de Audio y Podcast
    • Fotografía y Diseño Gráfico para Contenido Digital
    • Motion Graphics y Animación
    • Contenido Interactivo y Realidad Aumentada
    • Estrategia, Marketing y Monetización de Contenidos
  • Desarrollo Móvil
    • Fundamentos de Desarrollo Móvil
    • Desarrollo Nativo Android con Kotlin
    • Desarrollo Nativo iOS con Swift
    • Desarrollo Multiplataforma con React Native
    • Desarrollo Multiplataforma con Flutter
    • Arquitectura y Patrones de Diseño Móvil
    • Integración de APIs y Persistencia Móvil
    • Testing y Despliegue en Móvil
    • Diseño UX/UI para Móviles
  • Diseño Gráfico y Arte Digital
    • Fundamentos del Diseño Gráfico y Digital
    • Diseño de Identidad Visual y Branding
    • Ilustración Digital y Arte Conceptual
    • Diseño Editorial y de Empaques
    • Motion Graphics y Animación 3D
    • Diseño Gráfico Asistido por Inteligencia Artificial
    • Creatividad e Innovación en Diseño
  • Programación
    • Fundamentos de Programación e Ingeniería de Software
    • Herramientas de IA para el trabajo
    • Matemáticas para Programación
    • Programación con Python
    • Programación con JavaScript
    • Programación con TypeScript
    • Programación Orientada a Objetos con Java
    • Desarrollo con C# y .NET
    • Programación con PHP
    • Programación con Go y Rust
    • Programación Móvil con Swift y Kotlin
    • Programación con C y C++
    • Administración Básica de Servidores Linux
  • Negocios
    • Fundamentos de Negocios y Emprendimiento
    • Estrategia y Crecimiento Empresarial
    • Finanzas Personales y Corporativas
    • Inversión en Mercados Financieros
    • Ventas, CRM y Experiencia del Cliente
    • Operaciones, Logística y E-commerce
    • Gestión de Proyectos y Metodologías Ágiles
    • Aspectos Legales y Cumplimiento
    • Habilidades Directivas y Crecimiento Profesional
    • Diversidad e Inclusión en el Entorno Laboral
    • Herramientas Digitales y Automatización para Negocios
  • Blockchain y Web3
    • Fundamentos de Blockchain y Web3
    • Desarrollo de Smart Contracts y dApps
    • Finanzas Descentralizadas (DeFi)
    • NFTs y Economía de Creadores
    • Seguridad Blockchain
    • Ecosistemas Blockchain Alternativos (No-EVM)
    • Producto, Marketing y Legal en Web3
  • Recursos Humanos
    • Fundamentos y Cultura Organizacional en RRHH
    • Atracción y Selección de Talento
    • Cultura y Employee Experience
    • Gestión y Desarrollo de Talento
    • Desarrollo y Evaluación de Liderazgo
    • Diversidad, Equidad e Inclusión
    • AI y Automatización en Recursos Humanos
    • Tecnología y Automatización en RRHH
  • Finanzas e Inversiones
    • Fundamentos de Finanzas Personales y Corporativas
    • Análisis y Valoración Financiera
    • Inversión y Mercados de Capitales
    • Finanzas Descentralizadas (DeFi) y Criptoactivos
    • Finanzas y Estrategia para Startups
    • Inteligencia Artificial Aplicada a Finanzas
    • Domina Excel
    • Financial Analyst
    • Conseguir trabajo en Finanzas e Inversiones
  • Startups
    • Fundamentos y Validación de Ideas
    • Estrategia de Negocio y Product-Market Fit
    • Desarrollo de Producto y Operaciones Lean
    • Finanzas, Legal y Fundraising
    • Marketing, Ventas y Growth para Startups
    • Cultura, Talento y Liderazgo
    • Finanzas y Operaciones en Ecommerce
    • Startups Web3 y Blockchain
    • Startups con Impacto Social
    • Expansión y Ecosistema Startup
  • Cloud Computing y DevOps
    • Fundamentos de Cloud y DevOps
    • Administración de Servidores Linux
    • Contenerización y Orquestación
    • Infraestructura como Código (IaC) y CI/CD
    • Amazon Web Services
    • Microsoft Azure
    • Serverless y Observabilidad
    • Certificaciones Cloud (Preparación)
    • Plataforma Cloud GCP

Platzi y comunidad

  • Platzi Business
  • Live Classes
  • Lanzamientos
  • Executive Program
  • Trabaja con nosotros
  • Podcast

Recursos

  • Manual de Marca

Soporte

  • Preguntas Frecuentes
  • Contáctanos

Legal

  • Términos y Condiciones
  • Privacidad
  • Tyc promociones
Reconocimientos
Reconocimientos
Logo reconocimientoTop 40 Mejores EdTech del mundo · 2024
Logo reconocimientoPrimera Startup Latina admitida en YC · 2014
Logo reconocimientoPrimera Startup EdTech · 2018
Logo reconocimientoCEO Ganador Medalla por la Educación T4 & HP · 2024
Logo reconocimientoCEO Mejor Emprendedor del año · 2024
De LATAM conpara el mundo
YoutubeInstagramLinkedInTikTokFacebookX (Twitter)Threads