¿Cómo nos pueden ayudar las herramientas de inteligencia artificial en el análisis de datos?
La inteligencia artificial se está convirtiendo en una herramienta indispensable para los analistas de datos. Durante los procesos de análisis, los analistas pueden enfrentar bloqueos o dificultades al formular preguntas, al crear gráficas, o al realizar análisis detallados de un dataset. Herramientas como ChatGPT pueden aliviar estos obstáculos al generar ideas y guiar el proceso analítico, aún si el dataset es desconocido o de un segmento de negocio nuevo para el analista.
¿Cómo comenzar con ChatGPT y un dataset?
Para empezar a utilizar ChatGPT con un dataset, es importante proporcionar la estructura del dataset a la herramienta. Por ejemplo, se puede describir un dataset relacionado a las ventas que incluya columnas como la fecha de venta, ciudad, país, y nombre del cliente. Debido a las limitaciones de contexto de ChatGPT, no se pueden cargar millones de registros, pero al describir las columnas, se abre la puerta a que ChatGPT sugiera preguntas analíticas resolubles con herramientas como Pandas en Python.
¿Qué preguntas analíticas pueden hacerse?
Una vez proporcionada la estructura del dataset, se pueden generar múltiples preguntas analíticas que pueden guiar al analista a las respuestas necesarias para el negocio. Algunas de estas preguntas podrían ser:
- ¿Cuáles son los 10 productos más vendidos en cada región y cada país?
- ¿Cómo se distribuyen las ventas de cada subcategoría de productos en distintos modos de envío?
- ¿Se venden más productos en ciertas subcategorías con un modo de envío específico?
Estas preguntas pueden ser tanto generales como específicas, y su formulación puede guiar a la resolución efectiva de problemas analíticos dentro de los datos disponibles.
¿Cómo usar ChatGPT para generar scripts en Python?
Supongamos que queremos calcular el tiempo promedio entre la fecha de pedido y la fecha de envío de los productos. Le podemos pedir a ChatGPT que nos genere un script en Python para resolver esta pregunta:
import pandas as pd
df = pd.read_csv('sales.csv')
df['Order Date'] = pd.to_datetime(df['Order Date'])
df['Ship Date'] = pd.to_datetime(df['Ship Date'])
df['Shipping Time'] = (df['Ship Date'] - df['Order Date']).dt.days
average_shipping_time = df['Shipping Time'].mean()
print(f"El tiempo promedio de envío es de {average_shipping_time} días.")
Al implementar el código en un entorno de desarrollo (IDE), podemos verificar y aplicar la solución al dataset específico.
¿Cómo mejorar con visualizaciones de datos?
Las visualizaciones de datos son cruciales para interpretar y comunicar resultados analíticos. ChatGPT puede ofrecer scripts que no solo analizan datos, sino que también los visualizan. Por ejemplo, al solicitar un script para los 10 productos más vendidos en cada región, ChatGPT no solo proporciona el análisis, sino también consejos para visualizar los resultados usando bibliotecas de visualización de datos como Matplotlib:
import matplotlib.pyplot as plt
import seaborn as sns
sns.barplot(x='Region', y='Sales', data=df_top_10)
plt.title('Top 10 Productos por Región')
plt.xlabel('Región')
plt.ylabel('Ventas')
plt.show()
Buenas prácticas y recomendaciones al usar inteligencia artificial
A pesar de las ventajas que brindan estas herramientas, es vital ser cauteloso al utilizarlas. Compartir datos demasiado sensibles puede representar un riesgo, ya que podrían ser utilizados para reentrenar modelos de IA. Además, los modelos como ChatGPT no siempre pueden analizar millones de datos debido a las limitaciones de contexto.
Motivamos a los estudiantes a explorar el archivo sales.csv
disponible en los recursos de la clase utilizando herramientas como ChatGPT para resolver múltiples preguntas analíticas. Este ejercicio no solo potenciará sus habilidades de análisis de datos sino que también ayudará a aprovechar al máximo estas potentes herramientas.
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?