Análisis de Datos con Pandas: Series y DataFrames en RetailData
Clase 14 de 32 • Curso de Python para Ciencia de Datos
Resumen
Funciones de Resumen y Estadísticas en Pandas
Vamos a explorar algunas funciones de resumen y estadísticas que podemos utilizar con nuestro DataFrame.
Uso de describe()
para obtener un resumen estadístico.
`# Resumen estadístico
summary = retail_data.describe()
print("Resumen estadístico:\\n", summary)`
Cálculo de la media y mediana.
Media:
mean_value = retail_data['Quantity'].mean()
print("Media de Quantity:", mean_value)
Mediana:
median_value = retail_data['Quantity'].median()
print("Mediana de Quantity:", median_value)
Suma y conteo de valores.
Suma:
total_sum = retail_data['Quantity'].sum()
print("Suma de Quantity:", total_sum)
Conteo de valores:
count_values = retail_data['Quantity'].count()
print("Conteo de Quantity:", count_values)
Desviación estándar y varianza.
Desviación estándar:
std_dev = retail_data['Quantity'].std()
print("Desviación estándar de Quantity:", std_dev)
Varianza
variance = retail_data['Quantity'].var()
print("Varianza de Quantity:", variance)
Mínimo, Máximo y Producto.
Mínimo:
min_value = retail_data['Quantity'].min()
print("Mínimo de Quantity:", min_value)
Máximo:
max_value = retail_data['Quantity'].max()
print("Máximo de Quantity:", max_value)
Producto:
prod_value = retail_data['Quantity'].prod()
print("Producto de Quantity:", prod_value)