- 1

Análisis de Datos con NumPy y Pandas en Python
03:32 - 2

Manipulación de Dimensiones en Arrays NumPy para Ciencia de Datos
12:05 - 3

Manipulación de Arrays NumPy para Análisis de Datos en Python
08:41 - 4
Álgebra Lineal Aplicada con NumPy: Operaciones y Ejemplos Prácticos
02:58 - 5

Indexación y Slicing en NumPy para Análisis de Datos
09:34 - 6

Operaciones con Arrays en NumPy: Broadcasting, Concatenación y Más
12:30 - 7

Identificación y conteo de respuestas únicas con NumPy
07:46 - 8

Manipulación de Matrices y Arrays en NumPy: Transponer, Invertir y Aplanar
07:07 - 9

Análisis de Ventas Mensuales con NumPy: Transformaciones y Insights
01:25 - 10

Operaciones de Álgebra Lineal con NumPy en Python
05:54 - 11
Conexión de NumPy con Pandas y Matplotlib para Análisis de Datos
03:20
Visualización de Datos con Matplotlib: Gráficos de Barras y Pastel
Clase 31 de 32 • Curso de Python para Ciencia de Datos
Contenido del curso
- 12

Análisis de Datos con Pandas: Carga y Exploración de DataFrames
09:21 - 13

Creación de DataFrames con Pandas en Python
14:06 - 14

Análisis de Datos con Pandas: Series y DataFrames en RetailData
11:22 - 15

Selección de Datos en Pandas: Uso de iLoc y loc
08:15 - 16

Manejo de Datos Faltantes en Pandas: Identificación y Tratamiento
11:19 - 17

Transformaciones y Manipulación de Datos con Pandas en Python
11:13 - 18

Análisis de Ventas con Pandas: Agrupaciones y Estadísticas
09:23 - 19

Filtrado de Datos en Pandas para Análisis Efectivo
12:27 - 20

Creación y manejo de Pivot Tables en pandas
07:07 - 21

Fusión de DataFrames con Pandas: merge, concat y join
12:10 - 22

Análisis de Series Temporales en Ventas Retail
15:46
- 23

Gráficos Básicos en Python con Matplotlib: Líneas y Dispersión
10:44 - 24

Personalización Avanzada de Gráficos en Matplotlib
06:46 - 25

Creación y Personalización de Gráficos con Matplotlib
12:32 - 26

Creación y personalización de histogramas y boxplots con Matplotlib
12:24 - 27

Visualización de Series Temporales con Python: Matplotlib y Pandas
15:22 - 28

Creación de Gráficos Combinados en Matplotlib con GridSpec
15:00
¿Cómo visualizar los datos de nuestras transacciones?
Visualizar datos no es solo una cuestión estética; es un pilar fundamental para entender y comunicar nuestras historias de datos de manera efectiva. En este contexto, utilizamos Matplotlib, una de las librerías más versátiles en Python, para realizar gráficos que representan nuestras transacciones. Nuestro enfoque principal es identificar las devoluciones y las transacciones efectivas en nuestra base de datos.
¿Cómo contamos las devoluciones y las transacciones sin devolución?
Comenzamos clasificando nuestras transacciones en aquellas con devoluciones y aquellas sin ellas. Utilizamos nuestro DataFrame para filtrar:
# Transacciones con devoluciones
total_devoluciones = df[df['cantidad'] < 0]
print(total_devoluciones.shape[0]) # Total de devoluciones: 8,872
# Transacciones sin devoluciones
sin_devoluciones = df[df['cantidad'] >= 0]
print(sin_devoluciones.shape[0])
Esto nos permite tener una visión clara sobre cuántas transacciones implicaron devoluciones versus cuántas no lo hicieron.
¿Cómo podemos crear un gráfico de pastel para visualizar devoluciones?
La visualización con gráficos de pastel nos ayuda a interpretar la proporción de transacciones con devoluciones frente a las que no. Así es como creamos este tipo de visualización:
- Importar Matplotlib y preparar los datos:
import matplotlib.pyplot as plt
labels = ['Devoluciones', 'No devoluciones']
sizes = [total_devoluciones.shape[0], sin_devoluciones.shape[0]]
colors = ['coral', 'lightgreen']
- Configurar y mostrar el gráfico de pastel:
plt.figure(figsize=(8, 8))
plt.pie(sizes, labels=labels, colors=colors, startangle=140, autopct='%1.1f%%')
plt.title('Porcentaje de Transacciones con y sin Devolución')
plt.show()
Este gráfico ilustra visualmente la relación entre devoluciones y transacciones exitosas, permitiéndonos identificar rápidamente tendencias o anomalías.
¿Cómo evaluar las ventas por mes y año?
Analizar las ventas por intervalos de tiempo puede ofrecer perspectivas únicas y detalladas sobre el comportamiento de compra. Al usar gráficos de barras, podemos deducir claramente cuál ha sido el comportamiento de las ventas a lo largo del tiempo.
¿Cómo creamos un gráfico de barras para las ventas?
El gráfico de barras es perfecto para visualizar cambios cuantitativos. Sigamos los pasos para implementarlo:
- Agrupar los datos por año y mes:
monthly_sales = df.groupby(['año', 'mes'])['total_amount'].sum()
- Diseñar el gráfico:
plt.figure(figsize=(12, 6))
monthly_sales.plot(kind='bar')
plt.title('Distribución de Ventas por Mes y Año')
plt.xlabel('Año, Mes')
plt.ylabel('Ventas Totales')
plt.show()
Esta estrategia nos permite identificar picos en las ventas y entender mejor el impacto estacional y mensual sobre el rendimiento de nuestras ventas.
¿Cuáles son los 10 productos más vendidos?
Finalmente, es esencial conocer cuáles productos se destacan en nuestro portafolio. Al crear un gráfico de barras horizontal del top de productos, conseguimos esta importante información.
¿Cómo agrupamos y visualizamos los productos más vendidos?
- Agrupar por
stock codey ordenar:
top_products = df.groupby('stock_code')['cantidad'].sum().sort_values(ascending=False).head(10)
- Dibujar el gráfico:
plt.figure(figsize=(12, 8))
top_products.plot(kind='barh', color='skyblue')
plt.title('Top 10 Productos Más Vendidos')
plt.xlabel('Cantidad Vendida')
plt.ylabel('Producto')
plt.gca().invert_yaxis() # Para que el producto más vendido aparezca arriba
plt.show()
Este gráfico nos dota de valiosos insights sobre qué productos impulsan más ventas y permiten un mejor posicionamiento estratégico.
En conclusión, el dominio de herramientas y técnicas de visualización de datos como las vistas aquí son esenciales para cualquier profesional en ciencia de datos. No solo enriquecen nuestras presentaciones, sino que también nos proporcionan la información clave para tomar decisiones informadas. Recuerda seguir practicando con tus propios sets de datos para fortalecer tu conocimiento. ¡El análisis y la visualización de datos ofrecen nueva luz sobre el camino a seguir en cualquier negocio!