Preguntas para descubrir insights en bases de datos económicas
Clase 5 de 14 • Curso de Visualización de Datos y Storytelling con Latinometrics
Contenido del curso
Clase 5 de 14 • Curso de Visualización de Datos y Storytelling con Latinometrics
Contenido del curso
José Pablo Castillo Ascencio
Gabriel Obregón
Eduardo Guzmán
Eduardo Guzmán
Francisco Chamorro
Fabian Siatama
Christian Rangel
Gabriel Londoño
Jonathan Iván Gordillo León
Julian Mancera
Natalia Molina
Andrea Gonzalez S.
LILIANA PALACIO
Jorge Ranni
Angelica Esteban
Maritza Medina
Kevin Caballero
Ernesto Canales
Christian Rangel
Idequel Bernabel Alvarez
Julian Mancera
Kevin Caballero
Yunior Rivera
Julián Camilo Giraldo Mejía
Juan José Cabrera
Fátima Torrez
Luis Alvarez
Paulo Esteban Orsini
Top 3 lecciones:
1) "No explores con una historia en mente, más bien deja que la historia te encuentre a ti."
2) "Las bases de datos son como un bosque, tu rol no es el de ser leñador o jardinero. Tu rol es respetar el bosque, examinarlo y entenderlo para después comunicar de qué está hecho este bosque."
3) "Llegar con curiosidad y mente abierta sin asumir la historia que hay detrás. Y luego hacerle preguntas a la Base de datos."
No explores con una historia en mente, más bien deja que la historia te encuentre a ti. Antes de proceder a jugar con los datos, es muy importante que tengas claro el rol de un analista o de un narrador de datos.
El rol del analista de datos
Imagina que una base de datos es como un bosque. Tu rol al trabajar con ese bosque no es el de un leñador o jardinero. No vienes a cortarlo, a plantar un jardín, sembrar unas rosas y dejarlo como tú quieras. Al contrario, tu rol es respetar el bosque, examinarlo y entenderlo para después comunicar de qué está hecho ese bosque.
En términos reales
Al trabajar con tu base de datos, debes llegar con una curiosidad y una mente abierta, sin asumir cuál es la historia que hay detrás de ellos. ¿Y cómo hacer para entender tu base de datos? Muy simplemente, haciéndole preguntas.
Ya me dió curiosidad que pasó con Guyana
Según cifras oficiales, Guyana pasó de producir un promedio de 1.200 barriles al día en 2019 a 400.000 en diciembre de 2023.
La razón principal es por el petróleo
Hay un error en la fórmula de crecimiento. Al darle formato porcentual en la hoja de cálculo, automáticamente se multiplica por 100. El verdadero crecimiento es del 20%.
Tienes toda la razón hay un error en la fórmula
No, en realidad sí aumenta 20 veces:
pasó de 712 millones a 14718 millones (20 veces más)
20% sería pasar de 712 millones a 854 millones
Nos dice que para un analista es muy importante no ir a los datos con una idea ya preestablecida sobre ellos, lo que hace un analista es observar y ver que tienen los datos para poder informar sobre estos tal y como son. Para ello nos ayuda hacernos preguntas como:
- Cuales son los valores más altos o más bajos, en el ejemplo nos dice cuáles son los países con mayor economía en 2020 y cuáles son los de menor economía.
- En el ejercicio hace una pregunta un poco más elaborada, se pregunta cuál es el país cuya economía ha crecido más en este último siglo.
- Guyana fue quien más crecimiento en su PI mostro en el último siglo, se puede ver en las gráficas que tiene un crecimiento exponencial en su último siglo, en 2022 tiene casi 20 veces lo que tenía en 2000.
- El resultado anterior ya nos lleva a preguntarnos, que paso con Guyana en ese tiempo para que su PI aumentara así. Ese es el poder de las gráficas, nos lleva a cuestionarnos del porque esos datos, que sucedió, que cosas influyeron, etc. Así es como se encuentran los insights en los datos.
Takeaways que considero más importantes:
¿Cuál es tu rol como stotyteller? Llegar con curiosidad y explorar los datos con la mente abierta.
¿Cómo lograr esto?
1) No explorar los datos con una historia en mente
2) Haciendole preguntas a los datos.
Algunos ejemplos de preguntas para explorar (En este caso):
Maximos, Mínimos y cambios en el tiempo. Más preguntas que se pueden hacer son ¿Qué paso para que esto fuera así?
Notas:
Ya han salido más datos, entonces las graficas pueden ser diferentes.
Usé la base de datos adjuntada en la clase y existe algunas discrepancia entre sus resultados y los que yo obtengo en el paso a paso.
Así es como se ve la grafica del PIB de guyana hoy en día, desde la pagina world in bank: nuevamente, hay algunas discrepancias respecto a lo que Ernesto Canales muestra.
Que buena técnica eso de conocer los datos y que la historia llegue sola
Ingresa a los datos sin prejuicios, deja que los datos te cuenten la historia.
El Producto Interior Bruto (PIB), o Gross Domestic Product (GDP), mide el valor de la producción de bienes y servicios de un país al valor monetario de cambio internacional.
Uno de los temas importante incluso en un compañía es esa capacidad y las habilidades para esos insigths de valor que permita realizar una presentación adecuada de los datos.
En ésas dos fuentes de datos que usan ustedes podemos encontrar datos de diferentes temas? No solo de economía?
La formula de variacion porcentual no deberia ser (2022-2000)/2000?
Ambas fórmulas funcionan!
si chequeas la aritmética de ambas fórmulas es la misma fórmula solo que en la que aplican en clase el 2000 se saca como factor
Limpieza de datos usando Google Sheets
Visión general: En esta clase, se enfatiza la importancia de comprender los datos antes de manipularlos. El analista debe llegar con curiosidad y hacer preguntas para revelar insights significativos.
Conceptos clave:
Ideas principales:
Ejemplos específicos:
Metodología:
Puntos de aprendizaje:
Referencias adicionales: No se mencionaron recursos adicionales específicos.
Preguntas de comprensión:
Nota: Resumido por la IA ADA.
Con que herramienta crean las cinematicas del curso? se ven geniales
Al ordenar de Mayor a Menor, aparece "Mundo" o "Ingreso alto" en el Top 1 La base de datos del Banco Mundial mezcla países reales con "agregados" (continentes, grupos económicos, etc.). Como estos grupos son sumas totales, siempre le ganarán a los países si solo ordenamos los números. Para que les quede el ranking limpio con países reales:
¡Espero que esto les ahorre un buen rato de frustración! 💚
Hola no sé cómo hace para visualizar tan rápidamente los datos de mayor a menor, que comando usa?
En este caso, seleccionas la columna en donde realizaste el calculo, es decir, donde sacaste el porcentaje. Creas el filtro y después seleccionas la siguiente opción:
¡Me pasó lo mismo!
¡Espero sirva!
Gracias a este curso, me llevo a darme unas vueltas por internet, Iran, Guyana y Chile. Tremendamente loco, es re entretenido :D
La clase se centra en la importancia de formular preguntas al analizar datos y descubrir historias detrás de ellos. Se compara el trabajo con una base de datos con explorar un bosque, donde el analista debe entender y respetar la información. Se ejemplifica cómo ordenar datos por economías más grandes y más pequeñas, y se muestra un caso específico de crecimiento del PIB de Guyana, que destaca un aumento significativo. El enfoque está en encontrar insights mediante curiosidad y análisis, preparando el terreno para la visualización en la próxima clase.
Limpieza de datos
La limpieza de datos se realiza mediante varios pasos clave. Primero, es esencial examinar la base de datos con curiosidad, formulando preguntas que te ayuden a entender su contenido. Luego, se procede a identificar y corregir errores, eliminar duplicados y manejar valores faltantes. En Google Sheets, puedes utilizar funciones como "FILTRAR" o "QUITAR DUPLICADOS" para facilitar este proceso. Finalmente, documenta los cambios realizados para asegurar la transparencia y facilitar futuras análisis.