Resumen

La inteligencia artificial se ha convertido en un aliado poderoso para quienes trabajan con datos. Cuando un analista enfrenta bloqueos creativos o desconoce un dataset, herramientas como ChatGPT pueden ofrecer dirección, generar código funcional y proponer visualizaciones sin necesidad de compartir información sensible. A continuación se explica paso a paso cómo aprovechar este enfoque de forma práctica y responsable.

¿Cómo generar preguntas analíticas con inteligencia artificial?

Uno de los mayores retos al iniciar un análisis es saber qué preguntas formular. Esto resulta especialmente complejo cuando el dataset pertenece a un segmento de negocio poco familiar. La técnica mostrada consiste en pasar únicamente la estructura del dataset —nombres de columnas como fecha de venta, ciudad, país, nombre del cliente, producto, subcategoría, modo de envío, entre otras— a ChatGPT, sin enviar los registros completos [0:20].

Con esa estructura, el modelo genera múltiples preguntas de analítica que se pueden resolver con pandas en Python. Algunas son generales y otras muy específicas, por ejemplo:

  • ¿Cuáles son los top 10 productos más vendidos en cada región y cada país?
  • ¿Cómo se distribuyen las ventas de cada subcategoría según el modo de envío?
  • ¿Cuál es el tiempo promedio entre la fecha de pedido y la fecha de envío?

Esta lluvia de ideas actúa como un catalizador del proceso analítico, orientando al analista hacia respuestas relevantes para el negocio [1:15].

¿Se pueden refinar las preguntas por tema?

Sí. Basta con pedir algo más acotado, como "dame cinco preguntas más acerca del producto y su relación con otras variables". ChatGPT responde con consultas enfocadas, por ejemplo, la relación entre subcategorías de productos y modos de envío específicos [1:30]. Esta capacidad de iterar sobre un mismo contexto acelera la exploración sin salir de la herramienta.

¿Cómo generar y ejecutar código Python desde ChatGPT?

Una vez elegida la pregunta, se le solicita a ChatGPT un script en Python para resolverla. En el ejemplo, se tomó la pregunta sobre el tiempo promedio de envío y el modelo devolvió código listo para copiar y pegar en el IDE [2:20].

Al ejecutar ese código sobre el archivo sales.csv, el resultado fue directo: el tiempo promedio de envío es de 9.2 días. Sin ajustes manuales, la respuesta fue correcta y coherente con el dataset [2:55].

¿Qué pasa con las visualizaciones de datos?

El mismo flujo aplica para gráficas. Se pidió un script que resolviera "cuáles son los 10 productos más vendidos en cada región" incluyendo visualización. ChatGPT generó código con Matplotlib que produjo gráficos separados por región: central, east, south y west [3:25].

Si el tipo de gráfica no convence, se puede solicitar otro estilo o incluso otra librería. Los modelos de lenguaje interpretan bien estas peticiones y ajustan el código en consecuencia.

¿Por qué no se deben compartir datos sensibles con estos modelos?

Este punto es crítico. Nunca se recomienda pegar fragmentos reales de datos en herramientas como ChatGPT o Copilot por dos razones principales [4:40]:

  • Privacidad y seguridad: se desconoce qué ocurre internamente con la información enviada; los datos podrían usarse para reentrenamiento de modelos.
  • Ventana de contexto limitada: los analistas suelen trabajar con miles o millones de registros, una cantidad que excede la capacidad de procesamiento de estos modelos.

La práctica correcta es compartir solo la estructura —columnas y tipos de datos— y usar la IA para obtener pistas de código, posibles visualizaciones o distintos puntos de vista sobre una pregunta de negocio.

¿Reemplaza la IA al analista de datos?

El proceso analítico requiere un alto nivel cognitivo. Los analistas poseen entendimiento del negocio y manejan variables contextuales que rara vez aparecen en un dataset. La inteligencia artificial funciona como herramienta complementaria —lluvia de ideas, generación de código, propuestas de visualización— pero no sustituye el criterio humano [4:15].

El archivo sales.csv está disponible en los recursos de la clase. Prueba llevar sus columnas a la herramienta de tu preferencia, formula preguntas analíticas y comparte tus resultados en los comentarios.