Visualización de valores faltantes

Curso de Manejo de Datos Faltantes: Detección y Exploración

Contenido del curso

Introducción a los valores faltantes

Manipulación inicial de valores faltantes

Búsqueda de relaciones de valores faltantes

Tratamiento de valores faltantes

Cierre de curso

21
Continúa aprendiendo sobre el manejo de valores faltantes
03:21 min

Tomar examen

Visualización de valores faltantes

Mario Alexander Vargas Celis

Estudiante

Para visualizar los valores faltantes en un DataFrame de Pandas, hay varias formas efectivas, y puedes aprovechar bibliotecas de visualización como matplotlib, seaborn, o incluso herramientas específicas como missingno. A continuación, te mostraré algunas de las formas más comunes.

### 1. Usar missingno para visualizar los valores faltantes

La biblioteca missingno es una excelente opción para visualizar los valores faltantes de manera rápida y efectiva.

#### Instalación:

Si no tienes instalada la biblioteca missingno, puedes instalarla con pip:


pip install missingno

#### Ejemplo de uso:

Una vez instalada, puedes usarla para visualizar los valores faltantes en tu DataFrame.


import missingno as msno

import matplotlib.pyplot as plt



\# Supongamos que riskfactors\_df es tu DataFrame

msno.matrix(riskfactors\_df)

plt.show()



\# También puedes utilizar un heatmap de correlación de valores faltantes

msno.heatmap(riskfactors\_df)

plt.show()

- **msno.matrix()**: Muestra una vista visual de los valores faltantes y no faltantes en el DataFrame.

- **msno.heatmap()**: Visualiza las correlaciones de valores faltantes entre las columnas del DataFrame.

### 2. Usar un heatmap con Seaborn para visualizar valores faltantes

Puedes crear un heatmap usando seaborn para representar los valores faltantes.

#### Instalación:

Si no tienes instalada seaborn, instálala con pip:


pip install seaborn

#### Ejemplo de uso:


import seaborn as sns

import matplotlib.pyplot as plt



\# Crear un mapa de calor donde se visualicen los valores faltantes

plt.figure(figsize=(10,6))

sns.heatmap(riskfactors\_df.isnull(), cbar=False, cmap='viridis')

plt.title("Mapa de calor de valores faltantes")

plt.show()

Este heatmap marcará con un color los valores que son nulos (True) y con otro color los que no lo son (False).

### 3. Usar un gráfico de barras con Matplotlib

Puedes visualizar los valores faltantes de cada columna usando un gráfico de barras.


import pandas as pd

import matplotlib.pyplot as plt



\# Contar los valores faltantes por columna

missing\_values = riskfactors\_df.isnull().sum()



\# Filtrar las columnas con valores faltantes

missing\_values = missing\_values\[missing\_values > 0]



\# Crear gráfico de barras

missing\_values.plot(kind='bar', figsize=(10,6))

plt.title("Valores faltantes por columna")

plt.xlabel("Columnas")

plt.ylabel("Número de valores faltantes")

plt.show()

Este gráfico de barras te mostrará cuántos valores faltantes tienes en cada columna.

### 4. Mostrar la distribución de valores faltantes con un conteo

Si prefieres simplemente contar los valores faltantes sin visualización gráfica:


\# Contar los valores faltantes en cada columna

missing\_summary = riskfactors\_df.isnull().sum()

print(missing\_summary)

Estas son algunas de las formas más útiles para identificar y visualizar los valores faltantes en tus datos. Dependiendo de la naturaleza de tu proyecto, puedes optar por una u otra, o combinarlas para obtener una visión más clara de los datos faltantes.

Visualización de valores faltantes

Introducción a los valores faltantes

¿Por qué explorar y lidiar con valores faltantes?

Operaciones con valores faltantes

Conociendo datasets para manejo de datos faltantes

Ejecución de Notebooks en Deepnote con %run

Extendiendo la API de Pandas

Tabulación de valores faltantes