Exportar datos de scraping a CSV, JSON y Excel

Resumen

Guardar los resultados de un scraper en el formato correcto define qué tan útiles serán esos datos para quien los reciba. Si tu audiencia es un usuario final, un programador o un equipo no técnico, cada perfil necesita una salida distinta: CSV, JSON, Excel o un formulario en la nube. Aquí te muestro cómo exportar la información extraída en cada uno de esos formatos.

¿Qué formato de salida conviene según quién use los datos?

La decisión depende del consumidor final. Antes de escribir una línea de código de exportación, define el perfil que recibirá el archivo.

  • Usuarios finales: prefieren CSV o Excel porque se abren fácil en cualquier hoja de cálculo.
  • Programadores: trabajan mejor con JSON, ideal para integraciones de software o bases de datos.
  • Equipos no técnicos: agradecen un Google Form vinculado a Google Sheets, accesible desde la nube sin instalar nada.

¿Cuál es el mejor formato para guardar datos de scraping? Depende de quién los consuma. CSV y Excel funcionan para usuarios finales, JSON para desarrolladores y Google Forms para equipos colaborativos en la nube.

¿Cómo exporto los resultados a CSV y JSON?

El flujo CSV es el que vienes trabajando: abres el archivo en modo escritura y guardas la lista como productos_eticos.csv. Sencillo y compatible con casi todo.

Para JSON, usas la extensión .json, modo escritura y codificación UTF-8. El detalle clave está en el parámetro indent=4, que organiza la salida en bloques legibles. Al abrir el archivo final, encuentras los 60 productos prolijamente alineados, listos para inspección visual o para que otra aplicación los consuma.

¿Cómo guardo los datos en Excel con Pandas?

Excel requiere una librería extra: Pandas. Si no la tienes instalada, ejecuta el comando de instalación correspondiente y luego impórtala en tu script.

La lógica es directa y se reduce a tres pasos:

  1. Importas Pandas.
  2. Conviertes la lista de resultados en un DataFrame.
  3. Exportas ese DataFrame a un archivo con extensión .xlsx.

Después de ejecutar, tienes un Excel limpio con tus productos, precios y URLs listos para compartir con cualquier persona que prefiera hojas de cálculo.

¿Cómo enviar datos del scraper a Google Forms sin usar la API?

Cuando trabajas con un equipo grande, guardar todo en la nube cambia la dinámica. Y hay un truco práctico: enviar los datos a un Google Form sin autenticación ni Google Cloud API, lo que reduce complejidad y costos.

¿Cómo preparo el formulario de Google?

Desde tu Google Drive, das clic derecho y creas un Formulario de Google. Agregas tres preguntas de respuesta corta: título, precio y image URL, replicando los campos que ya extrae tu scraper. Publicas el formulario y entras al menú de los tres puntos para elegir Rellenar previamente el formulario.

Ahí simulas una carga manual: por ejemplo, título Pinocho, precio 1500 y URL www.pinocho.com. Obtienes el enlace, lo copias y lo descompones en tu código.

¿Qué necesito en el código para enviar las respuestas?

La implementación usa dos librerías: Requests y Time. El procedimiento incluye:

  • Modificar el ID del formulario, que corresponde a todo lo que va después de la e/ en la URL.
  • Reemplazar también el valor del referer con ese mismo ID.
  • Definir en la carga (payload) los tres valores que se enviarán: título, precio e image URL.
  • Ejecutar el método POST para enviar la información.

¿Por qué aparece el error 401 al enviar a Google Forms? Es un problema de permisos. Para solucionarlo, entras al formulario, das clic en Compartir, vista del encuestado y eliges Cualquier persona con el enlace.

¿Cómo verifico que las respuestas llegaron?

Una vez ajustados los permisos, vuelves a ejecutar. En esta prueba se envían solo los primeros cinco elementos, no los 200 u 800 completos, porque conviene validar antes de cargar todo.

Al revisar el formulario, encuentras las cinco respuestas registradas. Y si quieres llevarlo un paso más allá, en la pestaña de respuestas eliges Crear una hoja de cálculo y obtienes todos los resultados volcados directamente en Google Sheets, listos para compartir o filtrar.

¿Qué sigue después de dominar el scraping estático?

Con esto cierras el flujo completo de un scraper para páginas estáticas: desde la extracción hasta la entrega de datos en el formato correcto para cada audiencia. El siguiente paso es escalar la técnica a páginas dinámicas, donde herramientas como Selenium y Playwright entran en juego para manejar contenido que se carga con JavaScript.

¿En qué formato sueles entregar los datos de tus scrapers? Cuéntalo en los comentarios.