Limpieza y Preparación de Datos en Power BI

Clase 6 de 25Curso de Power BI

Resumen

¿Cómo preparar datos para un informe en Power BI?

El éxito de un análisis de datos depende en gran medida de la calidad de los datos con los que se trabaja. A través de Power BI, podemos utilizar múltiples técnicas para limpiar y procesar nuestros datos, permitiéndonos construir informes que realmente respondan a nuestras preguntas. Aquí te explicamos algunos de los métodos clave utilizados para preparar datos en Power BI.

¿Cómo combinar tablas de años diferentes en Power BI?

Para consolidar los datos y facilitar su análisis, es esencial unificar información proveniente de diferentes fuentes, como es el caso de los datos de ventas por año. En este caso, hemos combinado nuestras tablas de 2021, 2022 y 2023 en un solo conjunto de datos.

  1. Renombrar Encabezados: Para cada tabla del año, usar la primera fila como encabezado.
  2. Combinar Tablas: Utiliza la opción Anexar Consultas para combinar los datos de los tres años en una nueva tabla única llamada "tickets".
  3. Deshabilitar Carga de Tablas Antiguas: Para limpiar el espacio de trabajo y evitar confusiones, deshabilita la carga de las tablas específicas por año, dejando solo la tabla combinada visible.
Hacemos clic derecho en cada tabla del año en el panel de consultas y seleccionamos 'Habilitar carga'. Esto desactivará la vista de estas tablas en el reporte, porque están reemplazadas por la tabla combinada.

¿Cómo solucionar problemas comunes en los datos?

A menudo, los conjuntos de datos pueden contener errores, como filas en blanco o formatos de datos incorrectos. Power BI proporciona herramientas para resolver estos inconvenientes.

  1. Eliminar Filas en Blanco: Dentro de Power BI, utiliza Reducir Filas y selecciona Quitar filas en blanco para deshacerte de los registros no deseados.
  2. Revisión de Tipos de Datos: Cambia los tipos de datos incorrectos, como convertir IDs numéricos a texto, ya que estos no representan cantidades sino identificadores descriptivos.
  3. Manejo de Valores Nulos: Donde un texto dice "none", reemplázalo por un valor nulo usando Reemplazar Valores y corrigiendo manualmente el código M, reemplazando el texto por null.
En la columna cliente ID, seleccionamos Reemplazar valores, ingresamos 'none' y para reemplazar con, escribimos 'null'. Luego corregimos en código M a 'null'.

¿Cómo estructurar y ordenar los datos?

Además de limpiar, es crucial estructurar las tablas de forma que los datos sean intuitivos de analizar. Esto implica asegurarnos que las columnas y categorías estén correctamente organizadas y alineadas con la lógica de negocio.

  1. Mover Columnas: Selecciona columnas que quieras mover al principio o final de la tabla para mejorar la legibilidad.
  2. Rellenar Datos Faltantes: Usa la opción de Rellenar hacia abajo para asignar automáticamente categorías a las subcategorías que carecían de estas.
Una vez que los valores en blanco han sido convertidos a nulos, aplica la función 'Rellenar hacia abajo' en las categorías de productos que portada en el encabezado.

Explorar las funcionalidades de Power BI nos ofrece múltiples herramientas para asegurar que nuestro conjunto de datos esté completamente preparado para análisis. Desde la combinación de tablas hasta el uso correcto de tipos de datos y manejo de valores nulos, cada paso es esencial para un análisis de datos exitoso. ¡No te detengas aquí, sigue aprendiendo y mejorando tus habilidades en Power BI!