Contenido del curso

Analiza PDFs y documentos con ChatGPT

Resumen

Trabajar con documentos largos en ChatGPT te permite resumir, extraer datos y comparar información en segundos. Esta guía te muestra cómo cargar archivos, validar resultados y aprovechar la vision para gráficos, ideal si manejas reportes, PDFs o presentaciones a diario.

¿Cómo cargar archivos en ChatGPT paso a paso?

La forma más simple es hacer clic en el signo más, seleccionar Agregar fotos y archivos y elegir el documento desde tu computadora. También puedes arrastrar el archivo directamente a la caja del chat o conectarlo desde OneDrive o SharePoint.

Una vez cargado, escribes tu prompt junto al archivo y la inteligencia artificial lo procesa. En la demo se usó el Índice Latinoamericano de Inteligencia Artificial, un reporte de 194 páginas, con un prompt sencillo: pedirle que analizara los principales resultados.

El modelo respondió con el estado del ecosistema, los países con mayor avance, el mapa regional y referencias a las páginas exactas donde extrajo cada dato. Esa trazabilidad es clave cuando manejas informes extensos.

¿Cuántos archivos puede leer ChatGPT a la vez? Hasta 10 archivos en una misma conversación, pero el rendimiento baja cuando los documentos son muy largos o complejos.

¿Qué es la ventana de contexto y por qué importa?

La ventana de contexto es el espacio de memoria que ChatGPT usa para sostener una conversación. Cuando cargas PDFs largos, ese espacio se llena rápido y el modelo empieza a olvidar lo que viste al inicio.

Por eso conviene seguir tres prácticas concretas:

  • Analizar pocos archivos por conversación.
  • Abrir chats separados para documentos distintos.
  • Llevar las conclusiones de cada chat a uno nuevo cuando necesites combinarlas.

En la demo, después del primer análisis se pudo pedir los 11 principales hallazgos sin volver a cargar el archivo, porque ya formaba parte del contexto activo.

¿Cómo analizar gráficos e imágenes dentro de un PDF?

Cuando el PDF tiene texto plano, ChatGPT lo lee sin problema. Pero si el documento incluye gráficos, tablas comparativas, fotografías o está escaneado, la lectura se complica. Ahí entra un truco simple pero poderoso.

Cuándo usar visión en lugar de lectura

La recomendación es extraer la pieza visual directamente del informe y pegarla como imagen en el chat. Al hacerlo, ChatGPT activa visión para procesarla, en vez de intentar leer el texto del PDF.

En la demo se copió un gráfico con las notas por país y el modelo identificó valores como Chile 70,56 y Brasil 67,39, coincidiendo con la imagen original. Esa validación cruzada es la que tú debes hacer siempre.

Convertir un gráfico en tabla editable

Un extra muy útil: pedirle que ordene los datos del gráfico en una tabla. El resultado lo puedes copiar directamente a un documento, una presentación o un dashboard. El mismo enfoque sirve con manuales de marca, cartas, posts o reportes técnicos.

¿Por qué a veces ChatGPT no lee bien un PDF? Porque el archivo tiene columnas múltiples, está escaneado o contiene imágenes con texto. La solución es entregarle ese fragmento como imagen.

¿Cómo combinar varios documentos en un mismo análisis?

Puedes cargar varios archivos juntos y pedirle que los sintetice o fusione. En la demo se subieron dos reportes: el Índice Latinoamericano de IA y un informe del World Economic Forum sobre el futuro del trabajo hacia 2030, ambos cercanos a 200 páginas.

La pregunta fue directa: cuáles son los desafíos para el futuro del trabajo respecto a las habilidades necesarias en un mundo con IA. El modelo leyó ambos documentos a la vez y condensó conclusiones que antes habrían tomado horas.

Si los archivos son muy densos, divide el trabajo:

  1. Analiza cada documento en una conversación separada.
  2. Guarda las conclusiones clave de cada uno.
  3. Abre un chat nuevo y combina ahí las síntesis.

Esto te da mejor calidad que cargar todo de golpe y saturar la ventana de contexto.

¿Qué validaciones debes hacer siempre?

La IA es un copiloto, no el piloto. Cada vez que extraiga información de un documento, revisa que los datos coincidan con la fuente. Cuando notes que le cuesta entender algo, entrégale ese trozo específico como texto o como imagen recortada.

Formatos que funcionan mejor:

  • PDFs nativos digitales, no escaneados.
  • Documentos a una sola columna.
  • Tablas y gráficos pegados como imagen para activar visión.
  • Archivos cortos cuando trabajes con varios a la vez.

Ahora elige uno de los documentos con los que trabajas habitualmente, súbelo y pídele a ChatGPT que lo resuma o extraiga lo más relevante. ¿Qué tipo de archivo vas a probar primero? Cuéntame en los comentarios.