9. IA para análisis de datos
Herramientas
- Que preguntas de analítica puedo resolver sobre un dataset (df) de pandas con estas columnas:
- Dame 5 preguntas más acerca del producto y su relación con otras variables.
- Toma una pregunta y pedirle un script para que genere la solución a la pregunta generada por el mismo
- Da contexto y ejemplos para hacer el análisis.
- No es una buena práctica pegar datos sensibles propios en un LLM.
Reto
- ¿Cuál es la categoría de productos más rentable en términos de ventas totales?
- ¿Cuál es el subcategoría de productos más vendida en cada región?
- ¿Cuál es el producto más vendido en segmentos de clientes específicos?
- ¿Existe alguna relación entre el precio de un producto y la cantidad vendida?
- ¿Cuál es el promedio de ventas diarias de productos en diferentes ciudades?
Por supuesto, aquí tienes un script en Python que resuelve la pregunta:
import pandas as pd
# Agrupar los datos por categoría de productos y sumar las ventas totales
category_sales = df.groupby('Category')['Sales'].sum()
# Obtener la categoría de productos más rentable en términos de ventas totales
most_profitable_category = category_sales.idxmax()
# Imprimir el resultado
print("La categoría de productos más rentable en términos de ventas totales es:", most_profitable_category)
En este script, asumimos que ya tienes un DataFrame llamado df
que contiene los datos. El código utiliza el método groupby
para agrupar los datos por categoría de productos y luego suma las ventas totales de cada categoría. Luego, se encuentra la categoría con las ventas totales más altas utilizando el método idxmax()
. Finalmente, se imprime el resultado.
Recuerda ajustar el código según el nombre de tu DataFrame y la columna que contiene las ventas (en este caso, asumimos que es la columna “Sales”).
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?
o inicia sesión.