Análisis de abandono de carrito con Power BI

Clase 18 de 22Curso de Visualización de Datos para BI

Resumen

Resolver un problema real de abandono de carrito de compras requiere reunir habilidades de conexión de datos, transformación y visualización en una sola entrega. Este proyecto integra todo lo aprendido sobre entrevistas con stakeholders, diseño de tableros y uso estratégico de colores para construir un análisis completo de segmentación de clientes, comportamiento regional y proyección de tendencias.

¿Cómo se define el problema de abandono y quiénes son los stakeholders?

El cliente detecta que los usuarios ingresan a su página, agregan productos al carrito de compra y no culminan la transacción [0:17]. Además, necesita comprender la interacción mediante clics y el tiempo de permanencia durante la navegación.

Para dar respuesta se identifican tres stakeholders clave:

  • Andrea Gutiérrez (gerencia y proyección): solicita analizar la segmentación de clientes, el comportamiento por región y una proyección futura del uso de la plataforma [1:00].
  • Juan Hernández (administración de bases de datos): organiza las bases de datos, provee accesos y permisos de conexión [1:21].
  • Samuel Torres (toma de decisiones): requiere un informe detallado con los resultados del análisis para corregir acciones a futuro [1:35].

Los requerimientos de Andrea se desglosan en tres niveles: primero, evaluar segmentos como clientes recurrentes, nuevos y ocasionales; segundo, identificar tendencias de productos y retención según la región geográfica; tercero, usar ese análisis histórico para proyectar el comportamiento futuro [2:30].

¿Cómo se extraen y transforman archivos JSON en Power BI?

En entornos profesionales la información no siempre viene en tablas de Excel. Es común recibir una URL de conexión y un access token que valida el acceso a la fuente de datos a través de APIs o endpoints [3:05]. Herramientas como Google Colab o Visual Studio Code permiten ejecutar notebooks con scripts de Python para realizar esa extracción. Incluso se recomienda apoyarse en inteligencia artificial para generar el script con un buen prompt [3:32].

Una vez descargados, los archivos llegan en formato JSON (JavaScript Object Notation). A diferencia de los archivos estructurados como Excel —organizados en columnas y filas—, los archivos JSON son datos semiestructurados que funcionan con pares de clave-valor y pueden contener colecciones y listas anidadas [4:10]. En el archivo de interacciones, por ejemplo, se encuentran campos como user ID, páginas visitadas, tiempo en la página en segundos, clics y fecha [4:35].

Para importarlos en Power BI se usa la opción Obtener datos, se selecciona el formato JSON y se indica la carpeta de origen [5:00]. Después viene la transformación:

  • Verificar que User ID sea texto.
  • Confirmar que segmento, tráfico y país sean texto.
  • Extraer solo la fecha cuando el campo incluye fecha y hora, usando Transformar > Extraer > Extraer antes del limitador con un espacio como separador [5:40].
  • Asignar la categoría de datos País o Región a la columna de país para que Power BI la reconozca como ubicación geográfica [6:25].

¿Qué visualizaciones responden a la segmentación de clientes?

El diseño del lienzo sigue un patrón de lectura tipo F, que guía la atención desde la parte superior hacia la parte vertical e incorpora información central [6:50].

¿Qué muestran las scorecards iniciales?

La primera scorecard presenta el recuento total de usuarios: doscientos usuarios interactúan con la página [7:10]. La segunda muestra el promedio de compra, calculado cambiando la agregación de suma a promedio: ochocientos cuarenta y cinco pesos en promedio por usuario [7:30].

¿Por qué elegir columnas agrupadas en lugar de líneas?

Inicialmente se prueba una gráfica de línea con meses en el eje X y segmentos en el eje Y, pero solo muestra el comportamiento global sin diferenciar segmentos. La solución es cambiar a una gráfica de columnas agrupadas, arrastrando segmentos al campo de leyendas para agrupar clientes frecuentes, ocasionales, recurrentes y nuevos en cada mes [8:30].

Para la tendencia de compras se mantiene una gráfica de línea con el ID de transacciones y la jerarquía de mes [9:00]. La relación entre segmentos y volumen de ventas se representa con una gráfica de dispersión, colocando el segmento en valores y las ventas en ambos ejes [9:20].

¿Cómo se filtra por segmento de forma dinámica?

Se agrega un filtro o slicer en la parte superior del lienzo. Al arrastrar el campo segmento y configurarlo como mosaico en lugar de lista vertical, el usuario puede seleccionar clientes frecuentes, ocasionales, recurrentes o nuevos y ver cómo todas las gráficas reaccionan de forma dinámica [9:45].

El tablero cumple con los requerimientos funcionales, pero el paso final es capturar la atención de los stakeholders aplicando técnicas de colores, jerarquía visual y tipografía que eleven la presentación. Comparte tu propio diseño y cuéntanos cómo resolviste la personalización de tu tablero.