Contenido del curso
Fundamentos de Visualización
Herramientas de Visualización
Técnicas Avanzadas de Visualización
Aplicaciones Prácticas y Casos de uso
Modelado de datos para inventario en Power BI
Resumen
Cuando recibes un requerimiento de un stakeholder, el reto no es solo abrir Power BI y empezar a graficar. Antes hay un paso clave: traducir ese mensaje en preguntas concretas, identificar la fuente de datos y modelarla con tablas de hechos y dimensiones para que tu dashboard responda con claridad.
En este caso, Kelly, supervisora del área de bodega y productos, pidió un tablero dinámico para revisar precio de costo, precio de venta, movimiento de inventario y cantidades en existencia. Cuatro preguntas guían todo el diseño.
¿Cómo identifico al stakeholder y sus requerimientos?
Lo primero que haces al leer un correo de requerimiento es ubicar quién lo pide y desde qué área habla. Eso te da contexto sobre el vocabulario, los KPIs y el nivel de detalle que necesita.
Kelly mencionó cuatro variables que debes monitorear:
- Precio de costo de cada producto.
- Precio de venta unitario.
- Movimiento de inventario (ingresos y salidas).
- Cantidades en existencia.
¿Qué significa que un dashboard sea dinámico? Que el usuario puede filtrar, segmentar y cruzar datos por sí mismo, en lugar de leer cifras fijas. Implica usar gráficas interactivas y slicers.
Kelly fue explícita: lo quiere dinámico, no estático. Eso te obliga a pensar en filtros, segmentadores y visualizaciones atractivas que respondan sus preguntas con un par de clics. [00:48]
¿Cómo cargo y clasifico los datos en Excel antes de Power BI?
Antes de saltar a Power BI, puedes hacer un abrebocas en Excel porque comparten interfaz y herramientas. La ruta correcta es ir a Datos > Obtener datos > Desde un archivo > Excel, no abrir el archivo directamente, porque eso bloquea las opciones de transformación. [01:54]
Al seleccionar el archivo Productos 2024 y dar clic en Transformar datos, se abre el editor de Power Query, que es idéntico al de Power BI.
¿Qué tipos de datos debo validar columna por columna?
Cada columna tiene un tipo de dato correcto y asignarlo mal te genera conflictos en cálculos y relaciones. Estos fueron los ajustes del set:
- ID de producto: aunque empieza con "P" y dígitos, se clasifica como texto. Si lo dejas como número, el sistema lo rechaza. Recuerda que en un 99% los campos con ID son columnas clave que vas a relacionar con otras tablas.
- Nombre, categoría y subcategoría: texto.
- Costo producto y precio unitario: deben ser moneda, no decimal. Al cambiarlo, Excel inserta automáticamente la coma de miles y el punto de centavos.
- Fecha de ingreso: venía como fecha y hora, pero todas las horas eran iguales, así que no aportan variable diferenciadora. Se deja solo como fecha.
- Unidades compradas y unidades despachadas: número entero, porque no compras 1.5 mouse.
- Tipo de registro (ingreso o salida): texto.
¿Cómo verifico la integridad de los datos?
En la pestaña Vista del editor, activas las casillas de calidad de columnas, distribución de columnas y perfil de columnas. Aparecen tres indicadores tipo semáforo: válido, error y vacío. [05:30]
La regla es simple: válido al 100%, vacíos aceptables en algunos casos, errores nunca. Si encuentras errores, debes corregir, restringir o modificar antes de cargar.
¿Por qué a veces Power Query analiza solo 1.000 filas? Porque por defecto genera el perfil sobre una muestra. Si quieres revisar todo el set, cambia a generación de perfil de columnas completo en la barra inferior.
¿Qué diferencia hay entre tabla de hechos y tabla de dimensiones?
Aquí está el corazón del modelado. La tabla de hechos registra eventos con temporalidad: cada movimiento de inventario tiene una fecha y se repite N veces a medida que entran o salen productos. La tabla de dimensiones describe atributos finitos y únicos del producto.
En este caso:
- La tabla original Productos 2024 funciona como tabla de hechos porque incluye fecha de ingreso y movimientos.
- La tabla de dimensiones se construye extrayendo los 10 productos únicos (P001 a P010) con sus atributos: nombre, categoría, subcategoría, costo y precio unitario.
Por ejemplo, P001 es un altavoz de categoría electrónica, subcategoría audio, con costo 2.170,37 y precio de venta 2.821,48. Esos atributos no cambian, mientras que la tabla de hechos sí registra cada entrada y salida del altavoz en distintas fechas. [12:20]
¿Para qué sirve una tabla de dimensiones? Para filtrar la tabla de hechos. Te permite segmentar millones de movimientos por producto, categoría o subcategoría sin duplicar información.
¿Cómo conecto y modelo los datos en Power BI?
Con ambas tablas listas, abres Power BI y vas a Obtener datos > Libro de Excel. Seleccionas el archivo, eliges las hojas y das clic en Transformar datos. Aunque ya lo hayas hecho en Excel, esta doble validación es buena práctica porque algunos tipos de dato se reinterpretan al pasar de un entorno a otro. [15:45]
De hecho, en este ejercicio el costo del producto llegó como decimal y hubo que devolverlo a moneda. Lo mismo con la fecha, que volvió a traer la hora.
¿Cómo nombro mis tablas para mantener orden?
Una práctica que te ahorra dolores de cabeza es renombrar las tablas según su rol:
- A la tabla de hechos le antepones fact_ (por ejemplo, fact_Productos).
- A la tabla de dimensión le antepones DM_ (por ejemplo, DM_Inventario).
Así, cualquiera que abra tu modelo identifica de inmediato qué papel juega cada una.
¿Cómo se crean las relaciones entre tablas?
En el panel izquierdo de Power BI tienes cuatro vistas. La tercera, la de modelado, es donde defines relaciones. Power BI detecta automáticamente columnas en común y, en este caso, conectó la dimensión de inventario con la tabla de hechos a través del ID de producto. [18:10]
Esa relación es la que permitirá que un filtro sobre categoría afecte los movimientos de inventario y responda las preguntas de Kelly.
¿Tú cómo organizas tus tablas de hechos y dimensiones cuando recibes un requerimiento? Déjame tu enfoque en los comentarios.