Configuración Inicial
Configurar Looker Studio y Conectar la Primera Fuente de Datos
Crear Gráficos en Looker Studio y Analizar Ventas
Conectar una Fuente de Datos desde Google Sheets en Looker Studio
Agregar Filtros y Controles Interactivos en Looker Studio
Diseñar un Dashboard Accesible con Looker Studio
Quiz: Configuración Inicial
Análisis, Optimización y Seguridad
Integrar Datos de Inventario y Analizar la Disponibilidad de Productos en Looker Studio
Optimizar el Stock en Looker Studio
Parámetros para optimización en Looker Studio
Combinar Datos de Ventas y Clientes en Looker Studio
Segmentación de Clientes con Campos Calculados en Looker Studio
Manejo de Seguridad del Dashboard en Looker Studio
Optimizar la Carga y el Rendimiento del Dashboard en Looker Studio
Quiz: Análisis, Optimización y Seguridad
Técnicas Avanzadas
Conectar Múltiples Fuentes de Datos en Looker Studio
Expresiones Regulares y Transformación de Datos en Looker Studio
Optimización del Dashboard para Dispositivos Móviles en Looker Studio
Visualizaciones Comunitarias y Navegación en Looker Studio
Storytelling con Datos: Cómo Contar una Historia en Looker Studio
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
La limpieza y transformación de datos es un proceso fundamental en cualquier proyecto de análisis o visualización. Cuando integramos nuevas fuentes de información a nuestros dashboards, es común encontrarnos con inconsistencias, duplicados o formatos incompatibles que pueden afectar la interpretación correcta de los datos. En este artículo, exploraremos cómo resolver problemas comunes de calidad de datos en Looker Studio, utilizando campos calculados y expresiones regulares para unificar categorías y limpiar información inconsistente.
Cuando conectamos nuevas fuentes de datos a nuestros dashboards, es común encontrar discrepancias en el formato. En nuestro caso, al reemplazar el origen en las visualizaciones, identificamos tres problemas principales:
Para resolver estos problemas, utilizaremos campos calculados en Looker Studio, que nos permitirán transformar los datos sin modificar la fuente original.
El primer paso es crear un campo calculado para limpiar los nombres de productos que contienen caracteres extraños:
REGEXP_REPLACE(TRIM([nombre del producto]), "[^a-zA-Z ]", "")
Esta expresión hace dos cosas importantes:
Es importante anidar las funciones correctamente, ya que Looker Studio no permite usar dos funciones separadas en un mismo campo calculado.
Una vez creado el campo, simplemente reemplazamos el campo original "nombre del producto" por "nombre de productos dos" en las propiedades de la visualización, y veremos que el champú anticaspa aparece una sola vez.
Para el problema de las sucursales, donde teníamos duplicados por diferencias entre mayúsculas y minúsculas, la solución es aún más sencilla:
UPPER([sucursal])
Con este simple cambio, las seis categorías se reducen a las tres originales, unificando los datos correctamente.
Para resolver el problema de los métodos de pago, necesitamos un enfoque más detallado usando la función CASE:
CASE
WHEN CONTAINS([método de pago], "trans") THEN "Transferencia"
WHEN CONTAINS([método de pago], "Trans") THEN "Transferencia"
WHEN CONTAINS([método de pago], "tarjeta de crédito") THEN "Tarjeta de Crédito"
WHEN CONTAINS([método de pago], "tarjeta de Crédito") THEN "Tarjeta de Crédito"
/* Repetir para cada método de pago */
ELSE [método de pago]
END
Es crucial incluir la cláusula ELSE para mantener cualquier categoría nueva que pueda aparecer en el futuro.
También debemos prestar atención a las mayúsculas y minúsculas en las expresiones CONTAINS, ya que son sensibles a estas diferencias. Por eso tuvimos que añadir condiciones adicionales para "Trans" y "tarjeta de Crédito" con mayúsculas.
La limpieza de datos no es solo una cuestión estética, sino que impacta directamente en la calidad de los análisis y decisiones que se toman a partir de ellos:
Los problemas de formato suelen aparecer principalmente cuando se consolidan datos nuevos con antiguos o cuando se cambia de sistema. Una vez resueltos, es poco probable que vuelvan a surgir a menos que se realice otro cambio significativo en las fuentes de datos.
La capacidad de limpiar y transformar datos directamente en Looker Studio, sin modificar las fuentes originales, es una habilidad valiosa que permite mantener dashboards profesionales y confiables incluso cuando trabajamos con datos imperfectos.
La próxima vez que te enfrentes a problemas de inconsistencia en tus visualizaciones, recuerda que con campos calculados y expresiones regulares puedes resolver la mayoría de los desafíos de calidad de datos. ¿Has enfrentado problemas similares en tus dashboards? ¿Qué técnicas has utilizado para resolverlos? Comparte tu experiencia en los comentarios.
Aportes 2
Preguntas 0
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?