Práctica: storytelling para contar historias con datos

Clase 22 de 31Curso de Principios de Visualización de Datos para Business Intelligence (2021)

Vamos a hacer una demostración de storytelling utilizando los datos de la clase anterior y los descubrimientos que obtuve durante mi exploración.

¡Manos a la obra!

Como bien sabemos, al momento de referirnos a la Ciencia de Datos y a la Visualización de Datos, debemos de estar completamente seguros acerca de nuestros resultados sin importar lo más obvio o sencillos que estos pudieran parecer.

Lo primero que quise revisar fue la correlación entre dos variables, Las ventas (sales) y la utilidad (profit).

image4.png

Recordemos que la diferencia entre ventas y utilidad es extremadamente importante al momento de analizar los beneficios de nuestra organización:

  • Ventas (sales) puede definirse como el valor total de los productos vendidos
  • Utilidad (profit) es el resultado de sustraer a las ventas nuestros costos totales, en otras palabras, Utilidad = Ventas - Costos

¿Qué quiere decir esto?

La utilidad siempre va a ser más interesante de analizar porque tiene en cuenta los valores asociados al costo de un producto y es el margen de "ganancia" con el que se queda la empresa después de realizar una venta.

Déjame te lo ilustro con un ejemplo:

Si vendo una Hamburguesa a $20 USD (ventas), pero comprar y preparar los ingredientes me cuesta $5 USD (costos), entonces mi utilidad sería de $15 USD.

Venta de una hamburguesa: - Ventas: $20 USD - Costos: $5 USD - Utilidad: $15 USD

Ahora bien, tomando en cuenta la utilidad para esta exploración, mi idea inicial era la siguiente:

Primera pregunta de la exploración

Mi hipótesis inicial fue que "A mayores ventas, debe haber mayor Utilidad".

Entonces, simplemente debería comprobarlo utilizando una visualización de datos que me permita encontrar una correlación positiva (Scatterplot) entre dos variables (sales y profit).

De ser cierto, debería ver una gráfica parecida a la siguiente:

image1.png

Ejemplo de correlación positiva lineal entre dos variables: X y Y.

Resultado de la primera pregunta

Para este Data Viz decidí colorear las observaciones con una transición de Naranja a Azul, donde:

  • Azul = Profit positivo (ganancia)
  • Naranja = Profit negativo (pérdida)
  • Y una línea punteada para demostrar cómo debería ser la dispersión de una correlación positiva linear a modo de referencia
image6.png

Como puedes ver, estaba equivocado. La hipótesis que tenía al principio era falsa.

A mayor cantidad de ventas, NO SIEMPRE hay mayor utilidad.

Esto me dejó con más dudas que al inicio, pero al menos ya tenía borrada una idea equivocada sobre las utilidades y las ventas.

Así que, para seguir con la exploración, decidí realizar una segunda pregunta.

Segunda pregunta de exploración

Nueva pregunta: ¿por qué no todas las ventas tienen utilidad?

Para mi fortuna, la base de datos nos permite ver qué es lo que sucede:

image5.png

:eyes::eyes::eyes:

No es tan fácil de ver a simple vista, pero hay un factor importante por el que la cantidad de ventas no siempre aumenta la cantidad de ganancias.

:eyes::eyes::eyes:

Resultado de la segunda exploración

¡Los descuentos son el impostor!

Los descuentos están haciendo que no todas mis ventas generen utilidad porque, seguramente, provoca que la venta total sea por un precio menor al costo de los productos y, por lo tanto, le generen pérdidas (Profit negativo) a la empresa.

Para analizar rápidamente los descuentos simplemente quise poner un KPI, un disparador que me permita saber si el descuento es "aceptable" o "no aceptable". En este caso decidí que el descuento es "No aceptable" si supera el 30% en promedio sobre las ventas.

Cabe recalcar que un 30% en la industria de ventas generalmente es una cantidad muy fuerte y puede considerarse como algo fuera de lo común.

Para el siguiente Data Viz utilicé los puntos de geolocalización y nombre de la región que incluye la base de datos para ubicar las ventas en un mapa.

También utilicé una condicional como un disparador de KPI en donde el punto debe colorearse en color rojo si el descuento en promedio es "No aceptable" quedando de la siguiente manera:

image3.png
image2.png

¡Muy interesante!

Si inspeccionamos las ventas de la región central, sabemos que los descuentos excesivos están exclusivamente ubicados en los estados de Texas e Illinois.

Será muy interesante analizar más a fondo preguntas como:

  • ¿Cuáles son los productos más vendidos en esos estados?
  • ¿Cuáles son los menos vendidos?
  • ¿Quiénes son estos clientes?
  • ¿Todos los años muestran el mismo patrón?
  • ¿Todas las temporadas son iguales?

Pero deberemos dejar estas dudas para otra ocasión, ahora lo importante es que tú te encamines a realizar tu propia exploración y me cuentes tus descubrimientos.

¿Te diste cuenta de que usé el storytelling?

La idea es poder entretener a la audiencia con tus resultados y poder seguir adelante con tus descubrimientos sin nunca desenganchar el interés y la curiosidad de quien te escucha o lee.

Algunas de las buenas prácticas es utilizar analogías (las hamburguesas) para explicar con conceptos sencillos los términos más complejos así como definir "story points" y visualizaciones adecuadas a nuestro mensaje.

Si estás interesado en más sobre como poder hacer storytelling, te recomiendo tomar el Curso de Tableau: Visualización de Datos y Storytelling para Negocios, en el cual yo seré otra vez tu instructor con esta gran herramienta y hablaremos de los conceptos y la estructura de la narración de historias.

Anímate a contarme tu historia y la de tus descubrimientos y déjala en la parte de los comentarios, ¡recuerda que es una habilidad que se mejora con la práctica!

¡Nos vemos en la próxima clase!