Análisis de requerimientos y modelado de datos en Power BI

Clase 9 de 22Curso de Visualización de Datos para BI

Resumen

Convertir un requerimiento real en un tablero dinámico comienza con escuchar al stakeholder y traducir su necesidad en datos limpios, bien tipados y modelados. Aquí se muestra, paso a paso, cómo pasar del pedido de Kelly (supervisora de productos) a un modelo con tabla de hechos, tabla de dimensiones y relaciones en Power BI, listo para responder preguntas de inventario con filtros y gráficas eficaces.

¿Cómo perfilar al stakeholder y traducir su requerimiento en KPIs?

Kelly, como interesada principal, pide una solución dinámica, no estática. Necesita explorar ítems, inventario y bodegaje con foco en: precio de costo, precio de venta, movimientos de inventario y cantidades en existencia. La clave es diseñar una experiencia con filtros y visuales que permitan responder rápido sus cuatro preguntas.

  • Identificar al stakeholder: rol, área y expectativas de uso.
  • Extraer requerimientos: métricas y dimensiones esenciales.
  • Asegurar dinamismo: filtros claros y visuales intuitivas.
  • Traducir a datos: qué columnas y cálculos deben existir.

Habilidades puestas en juego: evaluación del interesado, extracción de requerimientos, diseño orientado a preguntas y priorización de KPIs.

¿Qué pasos seguir en Excel para preparar los datos?

Primero, usar Datos > Obtener datos > Desde un archivo > Excel para abrir “Productos 2024”, y luego “Transformar datos”. Esta ruta habilita herramientas de modelado y evita perder opciones al abrir directo. El foco inicial es asignar tipos de datos correctos y validar la integridad.

¿Cómo asignar tipos de datos correctos?

  • ID de producto: texto. Es clave y combina letras y dígitos.
  • Nombre, categoría, subcategoría: texto. Describen atributos del producto.
  • Costo producto: moneda. Es valor de dinero.
  • Fecha de ingreso: fecha. La hora no agrega variación; se simplifica.
  • Unidades compradas y despachadas: número entero. Ítems tangibles no admiten decimales.
  • Precio unitario: moneda. Valor para venta.
  • Tipo de registro (ingreso/salida): texto. Clasificación del movimiento.

Punto crítico: los campos con “ID” suelen ser llaves; mantenerlos como texto evita conflictos al relacionar tablas.

¿Cómo comprobar integridad con perfilado de datos?

Activar en Vista: mostrar espaciado, espacio en blanco, calidad de columnas, distribución de columnas y perfil de columna. El “semáforo” debe mostrar 100 % válido sin error; puede haber algo vacío si aplica. Para el análisis, elegir entre muestra de primeras mil filas o perfil de columnas completo si se requiere mayor certeza.

Buenas prácticas: - Hacer doble validación de tipos después de cambios. - Corregir campos que no adopten el tipo seleccionado. - Cerrar y cargar tras confirmar integridad.

¿Cómo definir tablas de hechos y dimensiones?

La presencia de fecha de ingreso sugiere una tabla de hechos con registros de movimientos (temporalidad y secuencia). Luego, crear una tabla de dimensión de inventario con ID único por producto y sus atributos.

Atributos en la dimensión inventario: - ID de producto único. - Nombre, categoría y subcategoría. - Costo del producto y precio unitario.

Interacción esperada: - La tabla de hechos registra ingresos y salidas en el tiempo. - La dimensión describe el producto y filtra la tabla de hechos.

Requerimientos cubiertos: - Valor unitario disponible en la dimensión. - Unidades compradas y despachadas en la tabla de hechos. - Costo del producto en la dimensión.

¿Cómo modelar y relacionar en Power BI para visualizaciones dinámicas?

En Power BI, conectar la fuente (Libro de Excel) y usar “Transformar datos” para repetir la validación: moneda en costos y precios, fecha sin hora. Mantener coherencia con lo ya definido en Excel mejora estabilidad.

  • Nombrar tablas por rol: “DM Inventario” para dimensión y “fact_table Productos” para hechos.
  • Revisar el panel izquierdo: lienzo, datos y relaciones.
  • Confirmar relaciones automáticas por ID de producto.
  • Preparar filtros desde la dimensión para controlar la tabla de hechos.

Buenas prácticas clave: - Doble validación de tipos y formatos. - Prefijos de nombres para entender el modelo. - Moneda y fecha correctamente configuradas. - Usar perfil de columnas completo si hay dudas.

Lo siguiente es evaluar el sentido de la relación entre hechos y dimensiones, porque define cómo fluye la información y el resultado de los filtros. ¿Qué visual te gustaría construir primero para responder a Kelly? Comparte tus ideas y preguntas.