Introducci贸n: fundamentos de la visualizaci贸n de datos

1

驴Qu茅 aprender谩s sobre la visualizaci贸n de datos?

2

驴Qu茅 es la visualizaci贸n de datos?

3

Florence Nightingale y la dama de la l谩mpara

4

Retos para aprender visualizaci贸n de datos

5

Importancia de la visualizaci贸n de datos: disminuye la carga cognitiva

6

Herramientas para visualizar datos: Excel, Tableau, Power BI, Google Analytics, Google Data Studio

7

驴C贸mo usar correctamente una gr谩fica? Ejemplos y usos de visualizaciones

8

Buenas pr谩cticas para visualizaci贸n de datos: user personas, mentiras estad铆sticas y principios de Gestalt

9

Caso Target: conflictos de 茅tica en la ciencia de datos y Big Data

Elige la gr谩fica correcta para tus reportes

10

Gr谩fica de barras

11

Gr谩fica de pie

12

Gr谩fica de dispersi贸n

13

Gr谩fica de burbujas

14

Gr谩fica de mapas

15

Tipos de mapas: isol铆neas, coropletas, diagramas, anam贸rficos

16

Gr谩fica de heat map o mapas de calor

17

Gr谩fica de tablas

18

Importancia del storytelling en la visualizaci贸n de datos

Data Visualization para Business Intelligence

19

驴C贸mo afecta la visualizaci贸n de datos en tu negocio?

20

Explora, descubre, pregunta: toma decisiones inteligentes con an谩lisis de datos

21

Pr谩ctica: an谩lisis y exploraci贸n de datos

22

Pr谩ctica: storytelling para contar historias con datos

23

Caso Walmart: integra visualizaci贸n de datos y Big Data con inteligencia de negocios

Flujo de trabajo y etapas del Business Intelligence

24

Recolecci贸n de datos

25

Limpieza de datos

26

Exploraci贸n de datos

27

Creaci贸n de gr谩ficas y visualizaciones

28

Generaci贸n de reportes con storytelling

29

Define objetivos SMART con KPIs o Key Performance Indicators

Recomendaciones finales para Visualizaci贸n de Datos

30

Caso Orbitz: beneficios de una cultura data-driven o basada en datos

31

Contin煤a aprendiendo Data Science, Business Intelligence y Visualizaci贸n de Datos

No tienes acceso a esta clase

隆Contin煤a aprendiendo! 脷nete y comienza a potenciar tu carrera

Recolecci贸n de datos

24/31
Recursos

Aportes 130

Preguntas 3

Ordenar por:

Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Reg铆strate o inicia sesi贸n para participar.

Dejo tres p谩ginas de datos abiertos bastante interesantes con las cuales quisiera hacer en un futuro proyectos:
https://data.worldbank.org/
https://www.kaggle.com/datasets
https://www.datos.gov.co/

Me gustar铆a tener una base de datos de Platzi para averiguar que hacen los tops estudiantes, el tiempo promedio que se le dedica a la plataforma, que cursos toman ciertos perfiles de alumnos, cuales son las carrera con mayores ganancia etc wow

Me gustar铆a saber los datos de los picos de felicidad, ira, y tristeza que mostramos todos en nuestras redes sociales durante esta pandemia, podr铆a ayudar tambi茅n para fortalecer los datos sobre prevenci贸n de suicidios debido a la depresi贸n鈥

Definitivamente para un proyecto de an谩lisis geogr谩fico de datos, donde pudi茅ramos ver el nivel de crecimiento econ贸mico dada la entrada de tecnolog铆as de la informaci贸n.

Me gustar铆a analizar la base de datos de un Banco. En Kaggle hay muchos para este proposito.

Como proyecto quiero entender que identifica un fraude bancario

Estas son algunas bases de datos que me gustar铆a usar para mis an谩lisis

Food Data Central

FoodData Central

FoodDb

FooDB

FAOSTAT

FAOSTAT

The Food Database Livsmedelsverket

The Food Database Livsmedelsverket

My Food Data

My Food Data

Calorie King

CalorieKing

La informaci贸n que recolectamos para nuestros estudios es diversa. Muestra de esto son las bases publicas o privadas. Las p煤blicas est谩n en internet y son de dominio general; las bases privadas son generadas por empresas y no puede tener acceso cualquier persona, por lo que debe solicitarse permiso en caso de querer utilizarse este tipo de informaci贸n.

Por otro lado, la informaci贸n puede venir estructurada o no estructurada, es decir ordenada o no y dependiendo de c贸mo venga, requerir谩 el esfuerzo adicional de estructurarla. Existen diversos tipos de archivos y fuentes desde los csv, xls, .py, etc. As铆 como venir de sectores p煤blicos como gobierno o privados como empresas especializadas.

Personalmente soy un obsesionado con las pel铆culas y sobre todo el cine cl谩sico, por lo tanto me gustar铆a recolectar un gran cantidad de datos de p谩ginas como IMDb (Internet Movie Data Base) y relacionarlas con mis pel铆culas favoritas y en general predecir mi gusto en base a mis pel铆culas rese帽adas en Letterboxd.

Recolecci贸n de datos

La informaci贸n que vamos a empezar a analizar puede ser muy diversa.

Las bases de datos publicas las puedes usar para tus proyectos o incluso trabajo. Las privadas generalmente son generadas desde la misma empresa con informaci贸n sensible que no debe ser divulgada鈥

Informaci贸n estructurada: Por ejemplo si viene ya organizada en una tabla.
Informaci贸n no estructurada: Puede ser un texto que se quiera analizar, requiere mayor esfuerzo para analizar.

Ac谩 hice una gr谩fica comparando esperanza de vida y GDP per c谩pita:
Se puede observar una correlaci贸n entre estas 2 variables.
El database es de Kaagle:
https://www.kaggle.com/ajaypalsinghlo/world-happiness-report-2021

Una base de datos de arte鈥 馃槂

Aqu铆 se encuentran Datasets interesantes https://www.kaggle.com/

Recolecci贸n de datos

Es la primera etapa del BI, la informaci贸n puede ser totalmente diversa, pueden ser string, n煤meros, informaci贸n gr谩fica. Todo se puede analizar. Bases p煤blicas (dominio general) o privadas (informaci贸n sensible). La informaci贸n puede ser estructurada (tabla) o no estructurada (como un texto) y esta 煤ltima requiere un trabajo extra. Entre los tipos se pueden encontrar los .csv que son informaci贸n separada por comas muy utilizado pero no son los 煤nicos. Las fuentes demogr谩ficas, educaci贸n o salud

A mi me gustar铆a analizar datos m茅dicos o del 谩rea de la salud para poder encontrar informaci贸n valiosa o tal vez conocer algunos patrones en estos datos.

Una base de datos que me permitiera analizar ciertas habilidades de jugadores que militan en ligas no tan conocidos y poder darlos a conocer a equipos medianamente grandes para que los compren y exploten su potencial. Hay equipos que lo hacen y me gustar铆a hacer proyectos de estos al respecto.

Las bases GIS de redes el茅ctricas de distribuci贸n
Informaci贸n de medidores inteligentes de distribuci贸n
Mediciones de generaci贸n distribuida.
Mediciones que se encuentran en los servidores SCADA de las empresas el茅ctricas

Mi meta en alg煤n momento mas avanzado, es analizar datos astron贸micos, y lograr entrar en alg煤n trabajo referente a ello, como lo es ALMA ac谩 en Chile.

En medio de la pandemia que estamos atravesando, creo que ser铆a interesante poder analizar los datos del Monitor P煤blico de Vacunaci贸n de Argentina, con informaci贸n actualizada cada 24 hs. Les comparto el link:
https://www.argentina.gob.ar/coronavirus/vacuna/aplicadas

Creo que un proyecto con alguna base de datos no SQL o no estructurada como mongo DB pudiera ser un buen ejercicio de an谩lisis y procesos ETL ya que creo (a menos que alguien me corrija) para las visualizaciones de datos se requiere trabajar con datos estructurados

Bases de datos sobre m煤sica! 馃帶

es importante medir todo para el an谩lisis de datos, y en muchos paises latinoamericanos esta practica todav铆a no es frecuente.

Multiples son los tipos de datos que valdr铆a la pena analizar, por ejemplo todos aquellos registros asociados a las entidades gubernamentales o a la afiliaci贸n del regimen de seguridad social de los habitantes de un pa铆s. Buscando encontrar su nivel de bienestar.

El solo poner una foto y el titulo, hace que el estudiante tenga que redactar lo que explica el maestro de manera verbal. La escritura al tomar notas se vuelve mas prolongado

Me gustaria hacer una base de datos para escuelas, saber que alumnos faltan y bajo que condiciones ocurren, asi poder hacer hipotesis para las mejoras de lso estudiantes

Me gustar铆a poder ver mis datos en Platzi, hasta cierto punto algunos datos ya nos los da, pero por ejemplo ver los cursos, tiempo completo, que d铆as u horarios, que dispositivos uso, los comentarios, etc. en un archivo csv
Incluso luego se podr铆a hacer un proyecto con esos mismos datos en un curso practico de business intelligence

Siempre me ha encantado la idea de poder analizar una base de datos que corresponda a tiempos y mejora operacional basada en timing. Para es un Dream-job poder tener una data as铆, analizarla y estimar resultados que beneficien. Eso me encantar铆a.

Llama la atenci贸n realizar base de datos de los precios de las criptomonedas por periodo, la relaci贸n que hay entre bitcoin y las altcoins y como les afectan los impactos macro y micro econ贸micos

DANE

Me gustar铆a analizar una base de datos sobre una entidad financiera, ya que es muy interesante poder conocer m谩s a detalle el core del negocio y donde estan sus fortalezas y debilidades.

Me gustar铆a trabajar con una base de datos sobre la perspectiva que tienen los ciudadanos acerca de las medidas tomadas por los diferentes gobiernos de la Uni贸n Europea, y c贸mo esa impresi贸n influye en la toma de decisiones electorales.

ambas publica y pribada

En el futuro seguramente usemos datos para predecir todo

Las bases que he utilizado son:
Passport Euromonitor
GlobalData
LegisComex
Statista
Joystor

Las 3 bases de datos que me gustar铆a analizar, son:

  • Transmilenio en Colombia.
  • Tiendas de ropa en Colombia.
  • Enfermedades por alimentaci贸n.

Reto: Bases de datos

Distintos tipos de archivos y fuentes

Informaci贸n estructurada y no estructurada

Bases p煤blicas o privadas

Diversidad

Our World In Data (ourworldindata .org)
Es una p谩gina con datos sobre infinitos t贸picos globales, con data viz incre铆bles y con la que se puede experimentar mucho

La base datos de la nasa para investigar calentamiento global, la del programa mundial de alimentos para ver posibles soluciones o analizar escritos antiguos y ver que relaciones hay entre si, ejemplo los sumerios

Google acad茅mico me pareci贸 un buena primera experiencia, sin embargo parece ser que es un motor de b煤squeda. Ahora kaggle, comentan mucho que puede ser de mucho aporte a la hora de querer analizar data frames as铆 que seguramente revise alguno de esos en el futuro. 馃挴馃挴馃挴馃挴

me gustar铆a una base de datos que tenga datos de sueldos, de hombres y mujeres en diferentes trabajo,

Me gustaria obtener acceso a bases del costo historico de productos del agro colombiano , con la finalidad de revisar la inflacion , zonas de cultivos y areas de mayor consumo.

Me gustar铆a analizar bases de datos relacionadas a las empresas de audio, ver que tipo de productos son los que mas adquieren los clientes, con que tipo de tecnolog铆as y que es lo que mas tienen en cuenta al momento de la compra, si la calidad de audio, o poor el contrario, solamente el precio.

Me gustar铆a analizar datos sobre mercados financieros: instrumentos de renta fija y variable, derivados y criptos. Quiero trabajar en instituciones financieras, sobre todo en una casa de bolsa.

Me gusta la informaci贸n que maneja la web de inaturalist.org, que es un proyecto de ciencia ciudadana y red social en l铆nea de naturalistas, cient铆ficos ciudadanos y bi贸logos basada en el concepto de mapeo e intercambio de observaciones de biodiversidad a trav茅s del mundo.

Las que cocnozco son kagle y datos abiertos de colombia. Quiero enfocarme en varias areas del conocimentos tanto de hacer un analisis de salud como de finanzas o de pelis, les recomiento leer los comentarios, nuestros compa帽eros compartieron una bases de datos intersantes que en particular no conocia,

Tengo un proyecto personal web sobre Harry Potter y he analizado sus libros transcritos.

quisiera tener una base de datos del sistema de salud y de la historia clinica de los colombianos, para asi crear una reforma a la salud.

Me gustar铆a trabajar con bases de datos de Spotify y de uso de streaming de m煤sica, primero para conocer las tendencias y como el algoritmo de Spotify realiza recomendaciones en funci贸n de nuestras reproducciones.

me encantar铆a trabajar con bases de datos de plataformas de streaming de cine, como MUBI o el CRITERION CHANNEL, tambi茅n en algo de videojuegos como riot games, cuya base de datos debe ser gigantesca y muy interesante

Yo estoy muy interesado en analizar los niveles de cumplimiento de las empresas transportadores de mercanc铆a.

  • Que empresa ofrece un mejor servicio, al mejor precio dependiendo el municipio o en las grandes ciudades dependiendo la zona de la ciudad.

Me gustar铆a mucho poder aprender a recoalectar datos de una base de datos sql, ya que trabajo muchos a帽os con esta base de datos y ahora quiero llevarla al mundo de ciencia de datos

Estar铆a interesante tener la base de datos de los valores de las propiedades en diferentes sectores de diferentes paises. Saber cuales se rentan o cuales se venden para as铆 poder hacer un an谩lisis y tomar decisiones a la hora de comprar propiedades. Algo as铆 tipo Zillow. pero no es USA.

Aqu铆 algunos datos abiertos de Colombia https://www.datos.gov.co/

Me gustaria tener una base de datos de desastres naturales, para poder analizarlos y poder alertas a las personas de sus posibles efectos

Me gustaria tener la base de datos sobre cultivos de marihuana para uso medicinal y cientifico en el pais porque es un mercado en crecimiento que tiene mucho potencial de crecimiento y que puede dejar muchismas ganancias en l mediano y largo plazo

En lo personal me gustaria tener acceso y trabajar con una base de datos relacionada al Futbol,
Alguna vez le铆 y adjunto el caso, que Liverpool FC implementa Data science para utilizarlo a su favor en la cancha: https://medium.com/the-spekboom/how-math-and-data-science-made-liverpool-the-best-team-on-the-planet-a72d50b325

Seria muy interesante tener acceso a la base de datos de distintas competencias y analizarlo tanto estadisticamente como en cuestion de las estrategias utilizadas de cada equipo tal como es el caso del Data Scientist del Liverpool. Actualmente me imagino que varios equipos ya les tomaron como ejemplo y cuentan con su equipo capaz de llevar a cabo estos modelos tambi茅n.

Me gustar铆a analizar una base de datos acerca de la deserci贸n de los estudiantes en un curso MOOC

A mi me gustaria analizar una base de datos de alguna plataforma de musica como spotify o deezer para analizar informacion como los generos mas escuchados a nivel mundial, artistas, cantidad de reproducciones totales de la plataforma, etc.

Me gustar铆a analizar un proyecto de componentes de pc en el cual se vea el cambio en las ventas, las subidas y bajas de precio, el estado actual del mercado, etc.

Siempre he practicado artes marciales y me gustaria hacer un estudio de las estadisticas de MMA puede ser de USA u otro pais.
Las preguntas que se me ocurren son:
-Los peleadores mayores hacen mas K.O o sumision?
-La duracion de la pelea se relaciona con la experiencia de los peleadores?
-Se aciertan mas golpes en la categoria femenina o masculina?
-Que especializacion en un arte marcial se relaciona con mas victorias?

Me gustar铆a analizar datos:
-financieros
-comunidad
-Pol铆ticos

La base de datos de una liga de futbol profesional. seria interesante analizar ese tipo de informacion

Esta p谩gina sirve para analizar el COVID en el mundo, tiene info de:

  • Q casos
  • Q vacunas
  • Q muertes
  • Divsion por Pa铆s

https://ourworldindata.org/coronavirus#coronavirus-country-profiles

Me llama mucha la atenci贸n los datos recopilados respecto al turismo mundial, por pa铆ses, por destinos, por continentes, etc. Creo que el turismo es una gran fuente de datos y hay mucho por analizar al respecto. Todos los pa铆ses deber铆an automatizar y profundizar su an谩lisis de turismo para tomar decisiones acertadas frente a sus inversiones.

Me gustar铆a ver bases de datos de waze sobre el trafico de CDMX y cruzarla con datos de asaltos, para ver puntos de riesgo especificos y con eso un plan de acci贸n.

Me encantar铆a trabajar con bases de datos deportivas, sobre todo de la NFL, MLB y NBA.

Me gustar铆a analizar que tipo de comida extranjera se consume mas en mi pa铆s, en qu茅 regiones, periodicidades y determinar comportamiento de consumo.

Me gustar铆a una BD donde pueda consultar los precios de cartas de TCGs de acuerdo al tiempo para poder hacer un modelo que prediga precios futuros de cartas nuevas.
Una BD que contenga una lista de las enfermedades m谩s comunes en el mundo y que estuviera segmentada por geograf铆a y contenga info. espec铆fica de los pacientes.
Una BD que contenga las 煤ltimas 100m de manos jugadas en high stakes en alg煤n cliente de poker para analizar tendencias de jugadores y desarrollar una estrategia ganadora en base al comportamiento del pool de jugadores.

a mi me gustar铆a analizar bases de datos de organismos y proteinas. Actualmente existen bastantes un ejemplo es Protein Data Bank
https://www.rcsb.org/

Bueno a mi en lo personal, me gustaria anlizar las bases de datos NO-SQL.

Me interesaria investigar datos de zonas con menos habitantes por zona metropolitana y zona rural en Europa y Centroam茅rica.

En M茅xico contamos con un organismo (INEGI) encargado de recolectar informaci贸n por medio de censos. Estoy empezando en el mundo del an谩lisis de datos y me encantar铆a realizar an谩lisis de sus bases de datos

Bases de datos sobre deportes, variables socioecon贸micas o cultura.

Aqu铆 pueden encontrar la base de datos de StackExchange:

https://archive.org/details/stackexchange

La base de datos con la que me gustar铆a en un futuro un proyecto ser铆a:

https://www.ine.gob.gt/ine/portal-estadistico-1-0/
https://www.datos.gob.gt/

mi proyecto personal con bases de datos es saber cuales son los art铆culos que mas se venden en el negocio en el que estoy trabajando.
y ver cuanto profit regresan esos art铆culos

Me gustar铆a empezar a recoger datos de la forma en la que mi madre hace tamales para vender, con esos datos lo que deseo hacer es mejorar los tiempos de producci贸n y bajar costos.

Definitivamente analizar los datos en redes sociales como fb, instagram, twitter de los fans de tus competidores.

Quiero usar el an谩lisis de datos para los emprendimientos y peque帽os negocios. De esta forma las personas podr谩n dedicarse a lo que les gusta, tan solo conociendo su negocio.

Una base de datos relacional, 煤ltimamente he visto una popularidad al momento de analizar datos con SQL. Sin embargo, yo creo que lo mejor ser铆a crear archivos CSV con la informaci贸n que se encuentre en las bases de datos y luego analizar esa informaci贸n con Pandas.

Algo sobre estadisticas de jugadores de futbol, lo vi una vez a Freddy hablando de eso en la epoca del mundial en un life y me llamo la atencion.

Una base de datos que quiero explorar es sobre las tarifas el茅ctricas de la CFE, en M茅xico, con el objetivo de identificar las zonas m谩s penalizadas con costos elevados en energ铆a. Tambi茅n busco crear modelos predictivos del precio en cada una de las tarifas (casas, negocios, etc) y calcular su valor en los pr贸ximos a帽os.
驴Por qu茅? Me dedico a la industria de la energ铆a solar, y para conocer el ROI de un sistema, es importante saber cu谩nto se va a dejar de pagar a CFE en pr贸ximos meses y a帽os.
Al final tener una frase tipo: 鈥淟a inversi贸n en este sistema solar la vas a recuperar en 3 a帽os y 5 meses, y tus paneles tienen un tiempo de vida 煤til de 25 a帽os鈥︹

Las fuentes de informaci贸n de gobierno proveen gran cantidad de datos para analizar.
Ya ser铆a cuesti贸n de indagar un tema de inter茅s.

A mi me gustar铆a analizar bases de datos con informaci贸n sobre:

  • Consumos de comodities por edades, sexo, ciudades, paises
  • Uso de espacios p煤blicos por horas, cantidades de personas, tipos.
  • Trafico en las v铆as mas congestionadas de la ciudad

Me gustar铆a analizar la comparaci贸n del porcentaje que paga un ciudadano promedio de impuestos vs el porcentaje que paga un millonario de impuestos.

Supongo que son datos n煤mericos pero no son de acceso p煤blico.

Me gustar铆a analizar bases de datos que tengan que ver con el lenguaje, particularmente con la frecuencia de uso de las palabras.

Encontr茅 esta p谩gina para tal cometido:
languagegoldmine .com/

Las bases de datos que mas me gusta analizar son las que contienen datos sobre el nivel de ingreso de una poblacion, por lo general estas bases de datos son de origen publico pero no se si sean los datos reales jaja.

La base de datos de spotify

驴Qu茅 base de datos me gustar铆a analizar y con qu茅 objetivo?

  • Deportivas con objetivos de apuestas
  • Pol铆ticas para identificar conductas de los votantes
  • Educativas para poder identificar conductas de los estudiantes y poder generar patrones que vinculen m谩s al alumno en el proceso educativo

Bases de datos sobre el consumo de diferentes tipos de postres y panes en el pa铆s.

suelo utilizar datos desde nasdaq y yahoofinance

Me gustar铆a una base de datos con la data generada por una cuenta de Twitter, donde se encuentre el comentario de la persona y sus reacciones de las personas a las que siguen a esta persona.
La idea principal es realizar un estudio de impacto [POSITIVO - NEGATIVO] del comentario.

Datos biom茅tricos, datos gubernamentales, datos globales, etc

Para BI es una herramienta que te ayuda con la visualizaci贸n de datos para sacar reportes,

Me gustar铆a analizar bases de datos que contengan variables del comportamiento de las personas en tiempos de covid, de manera de entender, cuanto m谩s ha aumentado el estr茅s, crisis de p谩nico otras similares.