Práctica: storytelling para contar historias con datos
22/31
Lectura
Vamos a hacer una demostración de storytelling utilizando los datos de la clase anterior y los descubrimientos que obtuve durante mi exploración.
¡Manos a la obra!
Como bien sabemos, al momento de referirnos a la Ciencia de Datos y a la Visualización de Datos, debemos de estar completamente seguros acerca de nuestros resultados sin importar lo más obvio o sencillos que estos pudieran parecer.
Lo primero que quise revisar fue la correlación entre dos variables, Las ventas (sales) y la utilidad (profit).
Recordemos que la diferencia entre ventas y utilidad es extremadamente importante al momento de analizar los beneficios de nuestra organización:
Ventas (sales) puede definirse como el valor total de los productos vendidos
Utilidad (profit) es el resultado de sustraer a las ventas nuestros costos totales, en otras palabras, Utilidad = Ventas - Costos
¿Qué quiere decir esto?
La utilidad siempre va a ser más interesante de analizar porque tiene en cuenta los valores asociados al costo de un producto y es el margen de “ganancia” con el que se queda la empresa después de realizar una venta.
Déjame te lo ilustro con un ejemplo:
Si vendo una Hamburguesa a $20 USD (ventas), pero comprar y preparar los ingredientes me cuesta $5 USD (costos), entonces mi utilidad sería de $15 USD.
Venta de una hamburguesa:
- Ventas: $20 USD
- Costos: $5 USD
- Utilidad: $15 USD
Ahora bien, tomando en cuenta la utilidad para esta exploración, mi idea inicial era la siguiente:
Primera pregunta de la exploración
Mi hipótesis inicial fue que “A mayores ventas, debe haber mayor Utilidad”.
Entonces, simplemente debería comprobarlo utilizando una visualización de datos que me permita encontrar una correlación positiva (Scatterplot) entre dos variables (sales y profit).
De ser cierto, debería ver una gráfica parecida a la siguiente:
Ejemplo de correlación positiva lineal entre dos variables: X y Y.
Resultado de la primera pregunta
Para este Data Viz decidí colorear las observaciones con una transición de Naranja a Azul, donde:
Azul = Profit positivo (ganancia)
Naranja = Profit negativo (pérdida)
Y una línea punteada para demostrar cómo debería ser la dispersión de una correlación positiva linear a modo de referencia
Como puedes ver, estaba equivocado. La hipótesis que tenía al principio era falsa.
A mayor cantidad de ventas, NO SIEMPRE hay mayor utilidad.
Esto me dejó con más dudas que al inicio, pero al menos ya tenía borrada una idea equivocada sobre las utilidades y las ventas.
Así que, para seguir con la exploración, decidí realizar una segunda pregunta.
Segunda pregunta de exploración
Nueva pregunta: ¿por qué no todas las ventas tienen utilidad?
Para mi fortuna, la base de datos nos permite ver qué es lo que sucede:
👀👀👀
No es tan fácil de ver a simple vista, pero hay un factor importante por el que la cantidad de ventas no siempre aumenta la cantidad de ganancias.
👀👀👀
Resultado de la segunda exploración
¡Los descuentos son el impostor!
Los descuentos están haciendo que no todas mis ventas generen utilidad porque, seguramente, provoca que la venta total sea por un precio menor al costo de los productos y, por lo tanto, le generen pérdidas (Profit negativo) a la empresa.
Para analizar rápidamente los descuentos simplemente quise poner un KPI, un disparador que me permita saber si el descuento es “aceptable” o “no aceptable”. En este caso decidí que el descuento es “No aceptable” si supera el 30% en promedio sobre las ventas.
Cabe recalcar que un 30% en la industria de ventas generalmente es una cantidad muy fuerte y puede considerarse como algo fuera de lo común.
Para el siguiente Data Viz utilicé los puntos de geolocalización y nombre de la región que incluye la base de datos para ubicar las ventas en un mapa.
También utilicé una condicional como un disparador de KPI en donde el punto debe colorearse en color rojo si el descuento en promedio es “No aceptable” quedando de la siguiente manera:
¡Muy interesante!
Si inspeccionamos las ventas de la región central, sabemos que los descuentos excesivos están exclusivamente ubicados en los estados de Texas e Illinois.
Será muy interesante analizar más a fondo preguntas como:
¿Cuáles son los productos más vendidos en esos estados?
¿Cuáles son los menos vendidos?
¿Quiénes son estos clientes?
¿Todos los años muestran el mismo patrón?
¿Todas las temporadas son iguales?
Pero deberemos dejar estas dudas para otra ocasión, ahora lo importante es que tú te encamines a realizar tu propia exploración y me cuentes tus descubrimientos.
¿Te diste cuenta de que usé el storytelling?
La idea es poder entretener a la audiencia con tus resultados y poder seguir adelante con tus descubrimientos sin nunca desenganchar el interés y la curiosidad de quien te escucha o lee.
Algunas de las buenas prácticas es utilizar analogías (las hamburguesas) para explicar con conceptos sencillos los términos más complejos así como definir “story points” y visualizaciones adecuadas a nuestro mensaje.
Si estás interesado en más sobre como poder hacer storytelling, te recomiendo tomar el Curso de Tableau: Visualización de Datos y Storytelling para Negocios, en el cual yo seré otra vez tu instructor con esta gran herramienta y hablaremos de los conceptos y la estructura de la narración de historias.
Anímate a contarme tu historia y la de tus descubrimientos y déjala en la parte de los comentarios, ¡recuerda que es una habilidad que se mejora con la práctica!
¡Nos vemos en la próxima clase!
Aportes 37
Preguntas 5
Ordenar por:
Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.
Se realizó la siguiente gráfica de dispersión entre las ventas y las utilidades agrupadas por descuento.
De esta manera podemos observar de manera rápida que a mayor el descuento, menores las ventas y peores las utilidades, podemos ver que cuando el descuento es de al rededor del 10% las ventas no son más altas que cuando no hay descuento pero se tiene buen margen de utilidad, por el contrario con descuentos del 70 y 80% las ventas se desploman además de las ganancias.
Entiendo que esto podría ser peor porque por alguna razón no hay muchas ventas con descuentos tan extremos, pero por desgracias las que se hicieron son suficientes como para que la rentabilidad de la empresa se pongan en peligro.
Dejo el código con el que hice esta gráfica en los comentarios de este mismo post.
Para tomar este curso recomiendo antes aprender algo de estadísticas y manejar un mínimo de Excel. Los retos que coloca el maestro para una persona que no tenga conocimientos mínimos con alguna herramienta de análisis van a parecer complicados.
Contestando las preguntas sobre Texas e Illinois:
Productos mas vendidos: Productos de tecnología
Productos menos vendidos: Office Suppliers
Quienes son los comprandores: Listado de compradores que gatan mas
Patrón de ventas: 3Q y 4Q son los que presentan una alza en las ventas
En la siguiente gráfica podemos darnos cuenta de los siguientes factores:
1.- La tecnología ocupa el mayor porcentaje de cobertura con respecto al 100% de la venta. Con un 36.4%
2.- La ciudad con mayor venta es New York con 256 mil dolares.
3.- El cliente que mas compra es Sean Miller con 25K.
4.- El último cuarto del año es cuando se tiene la mejor venta. Y los primeros meses es la mas baja.
Ahora sí logro comprender de una excelente explicación el uso del storytelling en la data viz. Estoy verdaderamente ansioso pro hacer el curso de Tableau.
Qué quiere decir con que el descuento supere el 30% sobre las ventas? Pregunto porque al buscar por descuentos mayores al descuento promedio mas 30% salen órdenes de varios estados además de Illinois y Texas
Analizando el dataset con Python queda demostrado que varios tipos de descuentos otrorgados por la firma generan utilidades negativas.
El rango de descuentos [0.32 - 0.70] aplicados a las ventas provocan utilidades acumuladas negativos.
Con la data entregadas quise plasmar un panel en que se visualice inicialmente el numero de ordenes gestionados por mes con su promedio, una gráfica de barras validando el total de ventas realizadas por mes. Porcentaje de ventas por categoria y porcentaje de medio de envío usados. Total ventas por estado y total de ventas por vendedor y categoría. Las visualizaciones fueron realizadas en Power BI el cual por medio de las interacciones que maneja y la dinámica nos permite filtrar la información y observar los diferentes comportamientos.
En el caso de la segunda imagen lo que quise buscar es desglose de las ventas para ver de cada categoría cuales son lo productos más vendidos y generan el mayor ingreso del negocio.
Hola,
Siguiendo lo mencionado en esta lectura, los estados donde se obtienen menores rendimientos son aquellos donde hay una mayor cantidad de descuentos, lo cual se puede evidenciar en la siguiente tabla, donde están los 5 estados con los más altos y mas bajos promedios del indicador Gross Profit Margin:
Esto también se puede evidenciar en los siguientes gráficos de correlación de los 10 estados con más bajo rendimiento en Profit y promedio de GPM. De igual manera, al analizar cada uno de estos estados por subcategoría, se puede evidenciar como los grandes descuentos están concentrados principalmente en 5, siendo estas: Bookcases, Tables, Appliances, Binders y Machines. Sería interesante revisar mas a fondo si esto obedece a una estrategia de marketing para reducir el inventario o cual puede ser la razón de estos grandes descuentos y su rentabilidad negativa.
Para finalizar hice una investigación acerca de cuáles son las categorías y sub categorías de cada una de las ciudades con más perdidas, y me encontré con que existen algunas subcategorías que tienen utilidades positivas, pero la mayoría por supuesto tienen utilidades negativas.
La primera pregunta que me hice dentro de mi análisis fue, ¿Cómo van los beneficios a lo largo de los años? La verdad no tenía ni idea de que pensar porque era la primera vez que tocaba los datos. Pero yo me imaginaba que bien, ya que era lo mínimo para una empresa. Para mi sorpresa resulta que está hipótesis estaba correcta. Los beneficios no había parado de crecer a lo largo de los años, por lo que había cosas que la empresa estaba haciendo bien.
La segunda pregunta que se me ocurrió fue ¿Cuál es la categoría que más vende? Para esta pregunta no tenía ninguna hipótesis previa, porque simplemente no conocía cuáles categorías existían. El descubrimiento de esta respuesta fue que en total todas estaban bastante parejas, por lo que no podría proponer examinar alguna para su eliminación.
Bueno, entonces se me ocurrió la siguiente pregunta ¿Cuáles son las ciudades más rentables? Y por consiguiente, ¿Cuáles son las Ciudades menos rentables?
Al darme cuenta de que había ciudades con perdidas, encontré un hilo interesante el cual analizar.
Bueno, hasta acá llegó el tiempo de hoy, estate [email protected] para la segunda parte. 😃
Mi hipótesis giraba entorno a los elevados gastos que implicarían los envíos por medio de: “First Class” y “Same Day”, después de todos tiene sentido que al ser envíos por medios especiales sus gastos sean altos y sus ingresos bajos o nulos.
Mi hipótesis giraba entorno a los elevados gastos que implicarían los envíos por medio de: “First Class” y “Same Day”, después de todos tiene sentido que al ser envíos por medios especiales sus gastos sean altos y sus ingresos bajos o nulos.
Mediante la gráfica pude comprobar que: ni los gastos son excesivos, así como tampoco los ingresos son bajos o insignificantes en relación a las ventas por este medio.
Para ser más específicos también quería corroborar a qué modo de envío y segmento de cliente pertenecía el grueso de las pérdidas y ganancias respectivamente.
Nuevamente mi primera hipótesis queda rechazada. El motivo de las pérdidas en nuestra base de datos NO se debía al modo de envío o al segmento de nuestros consumidores.
Así que tomando en cuenta el Análisis del profesor Luis Novelo decidí ponerle énfasis a los descuentos.
Por un lado las ventas que Sí generan ganancias segmentadas por: State, Product Name/Sub-category, Customer Name y City tienen en promedio un descuente de: 7.21%, 15.58%, 13.58% y 9.88%.
(No superan el 15% en descuento)
Por otro lados las ventas (segmentadas de la misma manera) que nos generan Pérdidas:
El descuento es ALTÍSIMO en estas transacciones (38,57%, 30.79%, 39.93%, 39.53%). Una completa locura!!!
Aquí les dejo más visualizaciones:
Aquí cabe aclara que nuestro gastos en “Furniture” son muy elevados lo que nos deja un “Profit” muy pequeño. Por lo que hay que tomar acciones encaminadas ha mejorar los costos en esta categoría de producto.
Gracias a esta visualización se puede comprobar que existe una serie de Clientes, Estados, Productos y Sub-categorías con las que jamás se ha obtenido ganancias. Con respecto a las Sub-categorías 2 de las 3 pertenecen a “Furniture” (Tables, Bookcases), lo cual puede explicar las bajas utilidades que nos genera esta categoría.
encontre que en 10 estados no se han ganado ni un solo dolar; al contrario, han perdido.
propondria reformar la politica de descuentos, es inaceptables perdidas de 25 mil dolares
Se comenzó por analizar lo más obvio que es son las ventas que tenemos por categorías la cuál es mostrada en la primera gráfica (arriba a la izquierda) en la cual la categoría ganadora sin duda es la correspondiente a “Technology”.
En la segunda gráfica (arriba a la derecha) se enlistaron los productos que tienen más ventas a los que tienen menos ventas, igualmente se indica a que categoría pertenece y mediante el grosor de la barra y con una etiqueta se puede visualizar la utilidad que nos ha generado cada producto. Podemos observar a simple vista que el segundo y tercer producto más vendido no nos está generando utilidad o incluso estamos perdiendo dinero.
En la tercera gráfica (abajo a la izquierda) tenemos ordenado a los clientes que más compras han hecho en la tienda ordenados de mayor a menor, igualmente mediante colores se indica a que tipo de cliente pertenece cada comprador. En este caso nuestro mayor comprador pertenece al tipo de cliente “Home Office” seguido por una compradora “corporation”.
En la cuarta gráfica se muestran las ventas trimestrales por año y mediante el grosor de la línea se indica las utilidades que hemos tenido, que generalmente suele ser mayor durante el último trimestre del año. En la misma línea se tiene señalizado mediante colores cuando se dan más descuentos en la tienda y resulta ser que igualmente el tiempo de mayores descuentos coincide con el de mayores utilidades que sería el cuarto trimestre del año.
No necesariamente las ganancias y las cantidades son correlaciones positivas, en algunos casos como en esta exploración es necesario comenzar desde un nivel macro para ir profundizando en el análisis y que en este viaje sea sencillo de comprender para mantener el interés de la audiencia.
Para mi al revisar la comparación de ventas, utilidades por categoría en los años 2014 a 2017 profundizaría en la
categoría de furniture ya que me parece que las utilidades son muy bajas para el nivel de ventas y buscaría si puedo encontrar eficiencias que me permitan lograr una mejor utilidad. Sino trataría de generar más ventas en las otras dos categorías con el objetivo de tener más utilidades.
Para pode empezar, a sugerir cambios a las gerencias debemos saber DÓNDE se pierde dinero.
Así que revisamos por categoría:
P. ¿Cúal es aquella categoría donde el descuento es mayor a la utilidad? (dónde estamos perdiendo)
R: La categoría FURNITURE
Luego: P. ¿Cúal es la subcategoría, dentro de FURNITURE, que genera pérdidas?
R: De las 4 subcategorías, 3 generan pérdidas (Bookcases, Chairs and Tables) , y solo una genera utilidad (Furnishings)
Dentro del análisis realizado encontré que las ventas aumentan pero a nivel de descuento los datos no concuerdan con los datos vs descuentos, también que el nivel de ventas aumenta para el caso de Illinois donde hay mas productos vendidos.
Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.