Análisis de Datos con Pandas: Series y DataFrames en RetailData

Clase 14 de 32Curso de Python para Ciencia de Datos

Resumen

Funciones de Resumen y Estadísticas en Pandas

Vamos a explorar algunas funciones de resumen y estadísticas que podemos utilizar con nuestro DataFrame.

Uso de describe() para obtener un resumen estadístico.

`# Resumen estadístico
summary = retail_data.describe()
print("Resumen estadístico:\\n", summary)`

Cálculo de la media y mediana.

Media:

mean_value = retail_data['Quantity'].mean()
print("Media de Quantity:", mean_value)

Mediana:

median_value = retail_data['Quantity'].median()
print("Mediana de Quantity:", median_value)

Suma y conteo de valores.

Suma:

total_sum = retail_data['Quantity'].sum()
print("Suma de Quantity:", total_sum)

Conteo de valores:


count_values = retail_data['Quantity'].count()
print("Conteo de Quantity:", count_values)

Desviación estándar y varianza.

Desviación estándar:


std_dev = retail_data['Quantity'].std()
print("Desviación estándar de Quantity:", std_dev)

Varianza

variance = retail_data['Quantity'].var()
print("Varianza de Quantity:", variance)

Mínimo, Máximo y Producto.

Mínimo:

min_value = retail_data['Quantity'].min()
print("Mínimo de Quantity:", min_value)

Máximo:

max_value = retail_data['Quantity'].max()
print("Máximo de Quantity:", max_value)

Producto:

prod_value = retail_data['Quantity'].prod()
print("Producto de Quantity:", prod_value)