- 1

Análisis de Datos con NumPy y Pandas en Python
03:32 - 2

Manipulación de Dimensiones en Arrays NumPy para Ciencia de Datos
12:05 - 3

Manipulación de Arrays NumPy para Análisis de Datos en Python
08:41 - 4
Álgebra Lineal Aplicada con NumPy: Operaciones y Ejemplos Prácticos
02:58 - 5

Indexación y Slicing en NumPy para Análisis de Datos
09:34 - 6

Operaciones con Arrays en NumPy: Broadcasting, Concatenación y Más
12:30 - 7

Identificación y conteo de respuestas únicas con NumPy
07:46 - 8

Manipulación de Matrices y Arrays en NumPy: Transponer, Invertir y Aplanar
07:07 - 9

Análisis de Ventas Mensuales con NumPy: Transformaciones y Insights
01:25 - 10

Operaciones de Álgebra Lineal con NumPy en Python
05:54 - 11
Conexión de NumPy con Pandas y Matplotlib para Análisis de Datos
03:20
Creación y manejo de Pivot Tables en pandas
Clase 20 de 32 • Curso de Python para Ciencia de Datos
Contenido del curso
- 12

Análisis de Datos con Pandas: Carga y Exploración de DataFrames
09:21 - 13

Creación de DataFrames con Pandas en Python
14:06 - 14

Análisis de Datos con Pandas: Series y DataFrames en RetailData
11:22 - 15

Selección de Datos en Pandas: Uso de iLoc y loc
08:15 - 16

Manejo de Datos Faltantes en Pandas: Identificación y Tratamiento
11:19 - 17

Transformaciones y Manipulación de Datos con Pandas en Python
11:13 - 18

Análisis de Ventas con Pandas: Agrupaciones y Estadísticas
09:23 - 19

Filtrado de Datos en Pandas para Análisis Efectivo
12:27 - 20

Creación y manejo de Pivot Tables en pandas
07:07 - 21

Fusión de DataFrames con Pandas: merge, concat y join
12:10 - 22

Análisis de Series Temporales en Ventas Retail
15:46
- 23

Gráficos Básicos en Python con Matplotlib: Líneas y Dispersión
10:44 - 24

Personalización Avanzada de Gráficos en Matplotlib
06:46 - 25

Creación y Personalización de Gráficos con Matplotlib
12:32 - 26

Creación y personalización de histogramas y boxplots con Matplotlib
12:24 - 27

Visualización de Series Temporales con Python: Matplotlib y Pandas
15:22 - 28

Creación de Gráficos Combinados en Matplotlib con GridSpec
15:00
¿Qué son las Pivot Tables en pandas?
Las Pivot Tables son una herramienta poderosa y versátil que nos permite resumir y reorganizar columnas de datos crudos de un DataFrame de pandas. Gracias a ellas, podemos realizar cálculos estadísticos comunes como sumas, conteos y promedios, ayudándonos a descubrir patrones ocultos y obtener insights valiosos de nuestros datos originales.
Al utilizar Pivot Tables, puedes:
- Resumir y reorganizar los datos.
- Identificar patrones.
- Comparar subgrupos de datos.
¿Cómo crear una Pivot Table?
Para crear una Pivot Table en pandas, debes seguir un proceso estructurado, especificando varios parámetros clave. Veamos cómo hacerlo paso a paso.
¿Cómo pasar la información al DataFrame?
El primer paso es definir el DataFrame que vamos a utilizar. Luego, especificaremos las columnas y los índices que deseamos tener en nuestra Pivot Table.
- DataFrame inicial: Debemos tener un DataFrame con los datos que queremos analizar.
- Columna de valores: Definimos la columna cuyo cálculo estadístico queremos realizar (por ejemplo, 'cantidad').
- Índice: En lugar de usar un índice posicional (como 0, 1, 2), se puede utilizar una de las columnas como índice. Por ejemplo, 'country'.
- Columnas: Incluir las columnas que deseas evaluar, como los 'stock codes'.
- Función de cálculo: Determina la función que aplicarás, como la suma, para mostrar las sumatorias totales en el índice.
import pandas as pd
# Crear una pivot table
pivot_table = pd.pivot_table(
data_frame,
values='cantidad',
index='country',
columns='stock code',
aggfunc='sum'
)
¿Cómo modificar las funciones agregadas?
Se pueden personalizar las funciones agregadas de nuestra Pivot Table según la necesidad del análisis.
En lugar de sumar, podemos calcular la media, por ejemplo:
# Modificar para utilizar la función de media
pivot_table = pd.pivot_table(
data_frame,
values='cantidad',
index='country',
columns='stock code',
aggfunc='mean'
)
¿Cómo apilar y desapilar datos en DataFrames?
El apilamiento y desapilamiento de datos son técnicas útiles cuando necesitas cambiar la estructura de tu DataFrame para análisis más profundos o para ajustar la presentación de la información.
¿Qué es el método stack en pandas?
El método stack convierte el índice de un DataFrame en una columna, apilando los datos.
# Usar el método stack para apilar datos
stacked_df = original_df.stack()
¿Qué es el método unstack en pandas?
El unstack hace el proceso contrario al stack, transformando columnas en índices.
# Usar el método unstack para desapilar datos
unstacked_df = stacked_df.unstack()
Un paso más allá con Pivot Tables
Las Pivot Tables y los métodos de apilar y desapilar ofrecen posibilidades casi ilimitadas para el análisis de datos. Ahora no solo estás limitado a índices posicionales; puedes modificar y utilizar columnas para un análisis más profundo y personalizado.
¡Explora estas funcionalidades y descubre cómo pueden aportar valor en tus proyectos actuales o futuros! Si tienes alguna idea de cómo aplicarás estos conceptos en el análisis de retail o en otro tipo de proyectos, comparte tus reflexiones. Estaré encantado de leerte y seguir aprendiendo juntos.