Introducción: fundamentos de la visualización de datos

1

¿Qué aprenderás sobre la visualización de datos?

2

¿Qué es la visualización de datos?

3

Florence Nightingale y la dama de la lámpara

4

Retos para aprender visualización de datos

5

Importancia de la visualización de datos: disminuye la carga cognitiva

6

Herramientas para visualizar datos: Excel, Tableau, Power BI, Google Analytics, Google Data Studio

7

¿Cómo usar correctamente una gráfica? Ejemplos y usos de visualizaciones

8

Buenas prácticas para visualización de datos: user personas, mentiras estadísticas y principios de Gestalt

9

Caso Target: conflictos de ética en la ciencia de datos y Big Data

Elige la gráfica correcta para tus reportes

10

Gráfica de barras

11

Gráfica de pie

12

Gráfica de dispersión

13

Gráfica de burbujas

14

Gráfica de mapas

15

Tipos de mapas: isolíneas, coropletas, diagramas, anamórficos

16

Gráfica de heat map o mapas de calor

17

Gráfica de tablas

18

Importancia del storytelling en la visualización de datos

Data Visualization para Business Intelligence

19

¿Cómo afecta la visualización de datos en tu negocio?

20

Explora, descubre, pregunta: toma decisiones inteligentes con análisis de datos

21

Práctica: análisis y exploración de datos

22

Práctica: storytelling para contar historias con datos

23

Caso Walmart: integra visualización de datos y Big Data con inteligencia de negocios

Flujo de trabajo y etapas del Business Intelligence

24

Recolección de datos

25

Limpieza de datos

26

Exploración de datos

27

Creación de gráficas y visualizaciones

28

Generación de reportes con storytelling

29

Define objetivos SMART con KPIs o Key Performance Indicators

Recomendaciones finales para Visualización de Datos

30

Caso Orbitz: beneficios de una cultura data-driven o basada en datos

31

Continúa aprendiendo Data Science, Business Intelligence y Visualización de Datos

Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Gráfica de dispersión

12/31
Recursos

Aportes 85

Preguntas 2

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Aquí dejo algunos ejemplos de gráficas de dispersión que usé con datos experimentales de una clase que tuve el semestre pasado 😄

En esta el conjunto de datos está en metros en ambos ejes, tomados de la distancia y altura en varios momentos del lanzamiento de un objeto y describen un comportamiento Polinómico de grado 2 (La ecuación que está arriba a la derecha)

En esta son los datos de la velocidad media en un objeto con aceleración constante, en donde la velocidad media aumenta linealmente con el tiempo (Ecuación de arriba a la derecha), de aquí también se puede deducir que la aceleración es constante porque el cambio en la velocidad media no varía con el tiempo.

Y por último, esta gráfica en la que describe la distancia sobre el tiempo en un objeto con aceleración constante (Es, de hecho, el mismo objeto anterior). El comportamiendo de d/t es Polinómico de grado 2 (Ecuación de arriba a la derecha)

Esta gráfica nos muestra la correlación que existe entre la venta de helados y la temperatura.

📚 Lo que intentamos averiguar con las gráficas de dispersión es saber el tipo de relación que existe entre dos variables:

  • 📈 Positiva: Incrementando
  • 📉 Negativa: Disminuyendo
  • 🙅🏽‍♂️ No hay correlación: están los datos dispersos.

La supremacía del chocolate.
Esta gráfica muestra la relación entre el gusto entre los consumidores de dulces para niños (win percent) y el porcentaje de azúcar contenido en estos (sugar percent).
Me gusta por que tiene dos añadidos más, muestra en colores si el dulce tiene chocolate o no. Aunado a lo anterior se agregan lineas de tendencia de ambos casos (chocolate o no).
Podemos sacar interesantes conclusiones de esto, puesto que a veces no parece haber relación muy aparente, por ejemplo si vemos los datos de porcentaje de azúcar contra el agrado de los dulces parece ser que no existe mucha relación, pero si agregamos un tercer factor que sería el contenido de chocolate podemos ver tendencias claras, ya que el que una golosina tenga chocolate y alto porcentaje de azúcar si tiene una relación con su índice de aceptabilidad entre los consumidores y este es mucho más alto que el de los dulces que no contienen chocolate

Scatter plot

Un posicionamiento en un plano de puntos según la correlación de dos variables.
Ayuda a entender como están relacionadas estas dos variables.

Qué hacer

  • Los colores son muy importante
  • Entender cual es la correlación


Qué NO hacer

  • No amontonar las anotaciones

Una humilde recomendación al team: Aunque hasta ahora en el curso todo se entiende a la perfección, podrían hacer “mirror” al vídeo porque al momento que el profe hace los gestos con las manos de lo que se muestra en las imágenes, puede haber quien se confunda un poco.
El curso va excelente!!!

Aquí dejo el gráfico de un estudio que se hizo sobre la relación de los resultados de las pruebas PISA en contraste con el índice de percepción de la corrupción en América Latina caso de estudio Ecuador.

Gráfica de dispersión:

Esta gráfica de dispersión viene de un ejercicio realizado en el curso de estadística descriptiva de Platzi en el cual se revisa la correlación que existe entre la longitud del pétalo y la longitud del sépalo de distintas especies de flores.

Comparto una pequeña gráfica de correlación entre el barril de petróleo WTI y una compañía argentina de extracción del mismo de tipo shale. Queríamos mostrar que el movimiento en el precio del barril influye directamente en el precio de la acción.

Primer gráfico, tiempo de reproducción de videos del feed de youtube

Segundo, clima de los último 4 días.

Regresión lineal con python. (Pueden tomar el curso de algebra lineal con python, aporta un montón más si ya sabes álgebra)


Es la relación Ventas / Clientes

Scaterplot sobre la tasa de diabetes e hipertension, en el cual existe una correlacion positiva en EEUU, a mayor tasa de Diabetes mayor hipertension

Una dispersión que hice en otro curso
![](

Total de venta de helados según la temperatura

La hice según los datos de mi celular, midiendo los pasos totales de una semana.

Las graficas de dispersión son de gran ayuda para la visualización de correlaciones entre variables, un ejemplo muy común y muy fácil que usamos los químicos es la ley de lambert & Beer, en donde nos muestra la correlación de absorbancia de luz de un material, nos ayuda bastante a cuantificar distintos analitos, como el analisis de un producto dada la reaccion química de una enzima con su sustrato, entre muchas otras aplicaciones.

Sigo analizando el dataset de Pokémon y aquí les dejo una scatter que relaciona el ataque y la defensa los pokémon. Además los colores distinguen si la observación (o el punto) representa a un legendario o no. Para esto use la librería de seaborn de python.
Saludos 😃

Encontré la relación de palabras habladas por mujeres en las diferentes películas de Disney. Se puede ver que hay una correlación positiva entre el porcentaje de palabras y el tiempo.

Esta gráfica representa la venta acumulada por año de los clientes y también el número de clientes atendidos.
Se puede observar que el mejor año de todos fue el 2018.

Parece que hay mas felicidad cuando hay mas dinero 💰😸 (según esta gráfica)

Es poco pero es trabajo honesto. 😄

En la gráfica se muestra la relación peso-precio en algunas laptops del mercado. 😃

En esta gráfica de dispersión se muestra el comportamiento del diodo al variar el voltaje que se le aplica, podemos observar en el eje x (voltaje) que conforme aumenta, la corriente mA (eje y) aumenta de una forma exponencial. Este método se utiliza para encontar el voltaje de umbral del diodo, es decir el voltaje necesario para que el diodo se polarize en directa y conduzca la corriente.

El gráfico de dispersión visualiza la media de ventas promedio versus la media de margen de cada vendedor, y podemos ver qué vendedores se distinguen por su rendimiento. Puede pasar el puntero del ratón sobre un vendedor y ver los detalles.

En el gráfico podemos ver que Lee Chin tiene el mayor volumen promedio de ventas. Stewart Wind tiene el mayor volumen de ventas total, seguido de Judy Thurman. Cheryle Sincock tiene un margen promedio significativamente menor que otros vendedores, pero supera a la mayoría de ellos en volumen de ventas promedio.

Aquí la gráfica de dispersión:

Está gráfica muestra una correlación positiva entre los ingresos y la inversión. Es decir, que entre más se invierta mayor ingreso. Esto es acerca de las campañas de publicidad de la serie Game of Thrones.

Reto: Gráfica de dispersión

Malas prácticas para la gráfica de dispersión.

Buenas prácticas para la gráfica de dispersión.

¿Qué es una gráfica de dispersión o scartter plot?

En este ejemplo se puede visualizar la correlación positiva y lineal entre el porcentaje de grasa y el IMC, a un mayor IMC se espera que haya un mayor porcentaje de grasa corporal.

Gráfico de dispersión:
Posiciona en un plano varios puntos según la correlación entre dos variables.
Ayuda a entender la correlación que puede llegar a existir, dependiendo de la tendencia de los datos.


En esta gráfica de dispersión se evidencia la correlación que existe, donde a mayor corriente debe presentarse un aumento en la tensión

El cuarteto de Anscombe es un interesante ejemplo de un dataset con similares propiedades estadísticas pero diferencias claras al visualizar sus respectivos gráficos de dispersión.
https://es.wikipedia.org/wiki/Cuarteto_de_Anscombe

Correlación entre PIB de países vs Tasa de Suicidio (1970-2020)


Muestra la correlación positiva entre el aumento de la temperatura y el aumento de las ventas de algún producto que podría ser helados.

En mi caso es una correlación positiva de las Ventas con las Ganancias a mayor ventas mayor ganancia!
Que por cierto si quiren saber como hacerlos suyos ocupen excel simplemente hagan una tablita y en insertar den en el icono de gráfica de dispersión! Así 👇

Aquí bien simple, un grafico de dispersión con correlación positiva.

Esta data viz ilustra las variables de reviews y valor de venta de una tienda, se evidencia que no hay una correlación directa entre las dos variables pero si podemos notar que nuestra calificación promedio esta por encima del 4,0

Relación de Cremciento de tiendas y Ventas por Empresa.

La correlación indica que solo algunas tiendas han logrado aumentar sus ventas y tiendas de manera proporcional.

No correlacionado.
Realizamos una visualización que nos permita ver la correlación entre el precio del producto y el valor del descuento, el siguiente grafico nos muestra que no hay ninguna correlación entre estos dos.

Relacioné el QB rating (métrica para medir la efectividad de un Quarterback en la NFL) con el porcentaje de partidos ganados. ¿Tener un buen QB gana partidos? Al parecer, si. Agradezco comentarios para mejorar mi gráfica.

A continuación les muestro el grafico de dispersión de un un conjunto de datos transnacionales que contiene todas las transacciones ocurridas entre el 01/12/2010 y el 09/12/2011 para una tienda minorista en línea registrada y con sede en el Reino Unido. La tienda vende regalos únicos para todas las ocasiones.


La grafica muestra que hay una correlación directa entre el costo total de los productos adquiridos y la cantidad.

Cantidad de reclamaciones por unidades producidas:

Algunos tipos de correlación

Recuerdo haber utilizado la gráfica de dispersión para ver comportamiento de precios, y también comportamiento de personas, es un tipo de gráfica muy interesante.

aquí mi ejemplo con el clásico iris

Se realiza el reto solicitado

No se si publicar esto en pregunta o aporte, pero para los que estamos empezando en el mundo del Data Analyst, que todavia no hemos visto Power BI o Tableau, deberia poner esos cursos antes de este en la manera de programar los cursos, osea, como nos vas a poner hacer una grafica de dispersion si no hemos visto Power BI o Tableau ? primero lo primero no ?

Utilizamos mucho este tipo de grafica Tableau es ideal para realizar este tipo de graficas.
En el ejemplo que pondré a continuación, se busco comparar el nivel de recomendación de una marca en particular vs el nivel de satisfacción que tenían estos usuarios con respecto a algunos atributos DE LA MARCA.

En este gráfico se representa en el eje x el porcentaje de alcohol y hue en el eje y.Y al realizar el scatter logramos identificar tres tipos de cultivos de vinos.

En esta gráfica podemos identificar una correlación positiva entre las variables % de grasa corporal la cual ubicamos en el “y” y el Indice de Masa Corporal (IMC) ubicado en el eje “x”. Para realizar este tipo de gráficas debemos tener en cuenta que las variables deben tener una relación para la interpretación de los datos.

Eje X dias dek mes, Eje Y cantidad de reuniones.

Scatter Plot : Son puntos en un plano que muestran la correlacion ( exista o no , positiva o negativa ) entre dos variables. Se hace una intersección para hallar el punto

Relación entre cuentas por pagar y proveedor.

Esta gráfica demuestra que existe una correlación positiva en la venta de autos que a mas caballos de fuerza también en esa medida aumenta los cilindros de los modelos de los años del 70 al 82.

Estos son datos fake entre una edad y un peso.

La siguiente gráfica muestra la cantidad de personas en las playas de south Miami en los primeros días del verano de 2019. Se ve una tendencia positiva a medida que pasan los días del verano:

Estos son datos donde la variable X es la temperatura a la que sucede una reacción y la variable Y la cantidad de energía que libera o consume la reacción a esa temperatura. El eje Y son kilo Joules y mientras más negativo más energía libera.

La relación entre las unidades vendidas y el total de ingresos tiende a ser positiva

Entre mayor diámetro, mayor será el peso

Este gráfico corresponde a una práctica de laboratorio de física en la que nos pidieron diseñar un voltímetro, un amperímetro y un ohmetro. El propósito de esta gráfica es mostrar experimentalmente que la escala de un ohmetro es no lineal. Nótense los “bigotes” que acompañan a cada punto del gráfico, estos se usan para denotar el error/apreciación del instrumento usado para medir la corriente (el amperímetro)

Análisis del grafico
El gráfico que analizare es el que se encuentra en la sección de enlaces y archivos.
Según lo que entendí creo que el siguiente gráfico tiene una correlación positiva es decir
cuando una variable aumenta la otra también aumentara o viceversa(si una variable disminuye la otra también disminuirá).
Es decir las variables se mueven en una misma dirección.
Observando el gráfico vemos que si la temperatura aumenta las ventas también aumentan.
Por lo tanto a mayor temperatura más helados se venderan .

Scatterplot of correlation between returns for ATT and Verizon
Los retornos de las acciones de las empresas de telecomunicaciones AT&T y Verizon entre julio de 2012 y 2015 demuestran una positiva correlación.

Correlación positiva, clasificada por tres categorias

Aquí mi ejemplo, cómo axis coloqué los resultados de una campaña en facebook dimensionados por fecha.

  • Impresiones vs clicks
  • clicks vs leads

😃

EL reporte a continuación es el que elaboré en la universidad. Este es la elaboración de un diagrama de dos fases( en este caso fenol y naftalina)
El primer diagrama y la tabla que la acompaña nos muestra el punto de inflexión, es decir a esa temperatura uno de los componente se convierte en líquido.
Al extraer esos puntos tenemos un digrama básico de dos fases, solo faltariá aguegar una linea Solidus horizontal por donde pasa el punto eutéctico.
DEjo mas información en el reporte 😄

Reto
Una scatter con la correlación de dos variables en el aumento de la temperatura a nivel global, población y producción de electricidad. Tienen una correlación positiva.

Este ejemplo es basado en los admitidos de un cine en el 2019, se toma la muestra de enero a agosto.

Es una grafica que muestra las perspectivas del riesgo global en el 2021.
El eje x es la probabilidad
el eje y es el impacto

Fuente
👾

En esta gráfica de dispersión se identifican dos variables, horas de estudio por notas de matemáticas para si entre más horas para estudiar aumentan la probabilidad de mejorar mi nota en el curso.

Ejemplo: Evidencia de correlación Entre la hora del día y el promedio de temperatura.

Gráfica errores humanos en producción vs rotación de personal en planta. Directamente proporcional, es decir, que en la medida que la rotación sea mas alta se presentan mas errores.

En el gráfico de dispersión, podemos visualizar que existe una correlación positiva entre la variable "índice de masa corporal (IMC), y el porcentaje de grasa corporal en adolescentes.

Mapped: The World’s Nuclear Reactor Landscape

Ejemplo gráfico de dispersión:

La siguiente gráfica nos muestra la relación entre las variables años de experiencia (eje x) y el salario (eje y); para esto, tenemos 8 puntos en el plano y, si trazáramos una línea de tendencia, esta tendría una pendiente creciente y positiva; podemos ver claramente que a medida que aumentan los años de experiencia, aumenta el salario que devenga el trabajador.

Beneficio y Cantidad por Estado

Adicional el color de los puntos puede darnos informacion, en otras variables, por ejemplo el tiempo. en la grafica adjunta, se muestran los distintos años con colores de puntos distintos.