Curso de Gemini

Analiza PDFs y videos con Gemini

Curso de Gemini

Contenido del curso

Analiza PDFs y videos con Gemini

Resumen

Analizar documentos con Gemini te permite transformar archivos largos en insights accionables en minutos. Si trabajas con PDFs, videos, planillas o transcripciones, esta capacidad multimodal te ayuda a pasar del análisis manual a decisiones rápidas, ideal para profesionales que buscan productividad real con inteligencia artificial.

¿Cómo cargar archivos en Gemini para analizarlos?

El primer paso es adjuntar el archivo a la conversación. Puedes arrastrarlo sobre la caja de texto o usar el signo más para subirlo desde tu computador, Google Drive, Google Photos o importar código desde otra plataforma [1:00].

Una vez cargado, el archivo se convierte en parte del contexto del prompt. Es decir, Gemini va a responder combinando lo que sabe como modelo entrenado con la información específica que acabas de entregarle.

¿Qué formatos soporta Gemini? PDFs, documentos de Word, planillas de cálculo, videos, audios, imágenes y transcripciones. Es un modelo multimodal, así que puede leer y generar en distintos formatos.

¿Por qué describir el archivo antes de pedir la tarea?

Cuando subes un documento, lo ideal es contextualizarlo igual que harías con cualquier prompt. Explica de qué se trata y qué tarea quieres resolver.

Por ejemplo, al cargar el reporte The Future of Jobs del World Economic Forum 2025, puedes pedirle: clasifica las habilidades en blandas y duras, e indícame las más relevantes considerando los desafíos de la adopción de IA [2:15]. Con ese contexto, el análisis se vuelve mucho más preciso.

¿Cuándo conviene usar el modelo de pensamiento de Gemini?

Siempre que pases archivos, te recomiendo activar el modelo de pensamiento. Este modo se detiene a revisar la información, evalúa cuál es la tarea solicitada e itera antes de contestar para encontrar el mejor camino [3:20].

El modelo rápido funciona bien si tienes prisa, pero el modelo de pensamiento logra un análisis más profundo. La diferencia se nota en documentos largos o cuando pides clasificaciones, comparaciones y recomendaciones estratégicas.

En el ejemplo del reporte WEF, Gemini detectó que el 39% de las habilidades básicas de los trabajadores cambiarán en los próximos cinco años. Identificó como habilidades blandas clave el pensamiento analítico, creativo y sistémico, la resiliencia, la flexibilidad y el aprendizaje continuo. Como habilidades duras destacó IA y big data, alfabetización tecnológica y ciberseguridad.

¿Qué es la ventana de contexto y cómo la aprovechas?

La ventana de contexto es toda la información disponible en una conversación: el documento cargado más los mensajes intercambiados. Mientras más rica sea esa ventana, más útiles serán las transformaciones que pidas después.

Una vez que Gemini entendió el reporte, puedes pedirle algo nuevo: en base a este documento, crea un cuestionario para que el equipo de recursos humanos haga un levantamiento del estado de las skills clave en la organización [5:40]. Y arma un documento de trabajo listo para enviar.

¿Para qué sirve analizar documentos con IA? Para transformar información en formatos útiles: resúmenes, cuestionarios, correos, reportes ejecutivos. El valor no está en leer el documento, está en lo que haces con los insights.

¿Cómo analizar videos de YouTube con Gemini?

Gemini, al ser parte de la suite de Google, tiene acceso directo a YouTube. Puedes pegar el link de un video y pedirle un resumen de los principales insights [7:30].

Lo que sucede internamente es que Gemini activa la herramienta de YouTube, accede a la transcripción del video y la analiza. En el ejemplo del video sobre Gemini 3 Pro de Freddy Vega en Platzi, el modelo extrajo los puntos clave y, lo más interesante, marcó el momento exacto del video donde se menciona cada idea. Si haces clic, te lleva al fragmento específico.

Esta capacidad acelera el análisis de fuentes audiovisuales que normalmente tomarían tiempo revisar manualmente.

¿Cómo transformar un análisis en otra entrega?

Después de analizar un video puedes pedir transformaciones concretas. Por ejemplo: escribe un correo electrónico pidiéndole a mi equipo que migremos a Gemini usando los insights y argumentos del video [9:10].

El resultado llega con asunto, saludo, argumentos ordenados y firma. Pasaste de una fuente de información a un entregable accionable sin abrir Word.

Algunas transformaciones útiles que puedes pedir:

  • Resúmenes ejecutivos por audiencia.
  • Cuestionarios de diagnóstico para equipos.
  • Correos de comunicación interna.
  • Tablas comparativas con prioridades.
  • Planes de acción derivados del documento.

¿Qué tipos de archivos puedes analizar con Gemini?

Más allá de PDFs y videos, Gemini procesa múltiples fuentes que sueles tener desperdigadas en tu día a día.

  • Transcripciones de reuniones generadas con IA.
  • Entrevistas en audio o texto.
  • Planillas de cálculo con data no estructurada.
  • Comentarios de redes sociales.
  • Documentos de Word y presentaciones.

La clave es que toda esa información, que normalmente requiere clasificación manual, puede ser analizada y transformada en formatos útiles para tomar decisiones más rápido.

¿Cómo se integra Gemini con Google Workspace?

Al ser parte de la suite de Google, Gemini genera sinergias con Gmail, Calendario y Google Drive, tanto en cuentas personales como empresariales. Puede analizar múltiples documentos, conectarlos entre sí y acelerar tu gestión diaria.

Ese es el salto real de productividad: dejar de gastar horas leyendo y empezar a concentrarte en las áreas donde generas mayor valor con los insights extraídos.

Cuéntame en los comentarios qué es lo primero que vas a ir a analizar usando Gemini.