La visualización de datos es la técnica de representar de manera gráfica los datos referidos a cualquier temática, con el fin de facilitar su interpretación. Pero, esta representación gráfica no puede efectuarse de manera caprichosa; pues, para ello existen estrategias que garanticen un resultado óptimo.
En este artículo me propongo resaltar la importancia de la estandarización de las visualizaciones de datos, con fundamento a las buenas prácticas en el análisis de datos en business intelligence.
Los seres humanos en su proceso evolutivo han desarrollado sus sentidos para percibir y entender la realidad que tiene lugar en su entorno, siendo la capacidad visual la que permite captar con mayor precisión y velocidad los datos que va recibiendo de varias fuentes.
En función a esta capacidad de los seres humanos, se ha desarrollado la técnica de transformar los datos que se encuentran expresados en formatos de texto y números, para convertirlos en imágenes gráficas que disminuyan la carga cognitiva que se origina al procesar, memorizar y recuperar la información necesaria para la toma de decisiones.
Este proceso de visualización de datos está regulado por principios que permiten la transmisión del mensaje a la dirección y gerencia de una organización en una manera concisa y fácil de interpretar, con el fin de hacer más eficiente el proceso de comunicación.
Por este motivo, la presentación de los datos a la gerencia a través de gráficos, obedece a un proceso de comunicación optimizado, que tiene el propósito de facilitar el análisis con el uso adicional de técnicas como dashboards y el storytelling, tomando como guía la estandarización o normalización de las visualizaciones según las pautas siguientes:
Cuando se presenta información que involucra múltiples variables o elementos para su comparación, los datos deben estar representados respetando la proporcionalidad para que sean un fiel reflejo de la realidad, tal como se evidencia en el siguiente gráfico:
En este gráfico se percibe que las barras correspondientes a cada variable mantienen una proporción entre ellas en función al valor cuantitativo que representan, permitiendo una correcta comparación entre cada una.
Ahora bien ¿qué sucede cuando esta proporcionalidad no es respetada?
La respuesta a esta pregunta se obtiene en el siguiente gráfico, donde se reporta información sobre los contagios de COVID-19 en Chile, Italia y España. Se observa como la diferencia de contagios entre Chile e Italia es de 1.194 casos, mientras que la diferencia de contagios entre Italia y España es de 1.700 casos; sin embargo, aun cuando entre estos dos últimos países la diferencia es mucho más significativa, se muestran ambas curvas más próximas que la resultante entre Chile e Italia.
Este gráfico evidencia una falta de proporción en la visualización de los datos. Algunas veces estas situaciones se deben a errores en el proceso de graficar, y otras veces se efectúa de manera intencional para engañar al receptor de la información.
En todo caso, sea por error o de manera intencional, la gráfica evidencia una situación completamente tergiversada que distorsiona la verdadera situación contenida en los datos.
Es importante que los ejes de las ordenadas (también llamados ejes de las Y) y las abscisas (o eje de las X), indiquen los valores correctos según la fuente de la información, con el fin de que faciliten el análisis de los datos y ofrezcan una mayor garantía y confianza.
En el gráfico anterior, sobre la curva de contagios de COVID-19, se observa que fue eliminado el eje Y, o eje de las ordenadas, situación que facilita la aparente intención de manipular los datos. Ahora, observa los dos gráficos siguientes.
Estos dos gráficos de barras identificados como 1 y 2, poseen exactamente la misma información. Ambos representan el número de muertes violentas de mujeres a mano de sus parejas en Europa.
El gráfico identificado con el número 1 refleja, a primera vista, que las muertes violentas de mujeres a mano de sus parejas en Europa indican resultados muy parecidos en la mayoría de los países estudiados; sin embargo, es preciso destacar que este gráfico posee una escala logarítmica.
En este caso, aun cuando no hay error en la representación gráfica, puede generar una falsa interpretación en los lectores que no se encuentren familiarizados con este tipo de escalas.
Entonces, ¿qué consecuencias se derivan de esta situación? Al construir un gráfico con una escala lineal, tal como lo refleja el gráfico identificado como número 2, arroja que el número de muertes violentas en España (ES) es significativamente mayor que la del resto de los países estudiados, situación que es completamente diferente a la reflejada en el gráfico con escala logarítmica.
En consecuencia, el uso de técnicas o herramientas especiales deben ser justificadas y notificadas a los usuarios de la información; pues, en caso contrario, se infiere que hay un propósito intencionado de provocar interpretaciones sesgadas.
En el caso de establecer comparaciones entre gráficos que posean información vinculada, deben mantener la misma escala, ya que hacer lo contrario conlleva a confusiones en su análisis. En los dos gráficos que se presentan a continuación, por un lado, se registran las ventas realizadas por una empresa “X” en los años 2014 al 2017, y en el otro gráfico, se visualizan las ganancias de esta misma empresa para los mismos años.
En primer momento, parece que las ganancias se encuentran al mismo nivel de las ventas, pero, al detenerse en el análisis de los ejes, se puede notar que los ejes en ambos gráficos son diferentes, lo cual genera confusión en el análisis, como resultado de una falta de uso de las buenas prácticas de la visualización de datos.
Ahora, analiza los siguientes gráficos:
En estos gráficos de líneas, en los cuales se han ajustados las escalas de los ejes, sus resultados reflejan el verdadero comportamiento de las ganancias con respecto a las ventas.
De esta manera, resulta evidente la importancia de mantener una correcta estandarización de las visualizaciones de datos en Business Intelligence, con fundamento al buen uso de las prácticas para su construcción; pues, en caso contrario, las interpretaciones que sean realizadas por los usuarios pueden desencadenar errores en la toma de decisiones.