Contenido del curso

Fundamentos prácticos de la IA generativa

Estructurando instrucciones claras y efectivas

Manejo de contexto extenso y datos

Tecnicas de razonamiento para tareas complejas

Aplicaciones y automatización profesional

Temperatura y Top P en Google AI Studio

Resumen

Si alguna vez obtuviste resultados distintos con el mismo prompt, no es un error: son dos configuraciones invisibles que determinan cómo responde un modelo de inteligencia artificial. Entender temperatura y Top P te permite pasar de resultados impredecibles a respuestas controladas y ajustadas a lo que realmente necesitas.

¿Por qué el mismo prompt genera resultados diferentes?

Imagina que preparas café con la misma receta y un día queda perfecto, pero al siguiente queda aguado o demasiado fuerte. Con la IA ocurre lo mismo: hay variables ocultas que afectan el resultado final aunque el prompt no cambie [0:24]. Estas variables se llaman temperatura y Top P, y están disponibles cuando interactúas con el playground de herramientas como Google AI Studio [1:04].

Ambos controles regulan la creatividad del modelo, pero lo hacen de maneras distintas. Dominarlos te da un poder enorme para adaptar las respuestas a cada tipo de tarea.

¿Qué es la temperatura y cómo afecta tus resultados?

La temperatura funciona como un termómetro de creatividad [1:14]. Valores bajos producen respuestas consistentes y predecibles: mismo formato, misma estructura, información estable. Valores altos abren la puerta a respuestas más variadas, sorpresivas y elaboradas [1:30].

¿Cómo se comporta una temperatura baja?

Con temperatura en 0.05, el modelo genera respuestas mínimas y seguras. En el ejemplo probado con el prompt "genera un cuento que se parezca a la Caperucita Roja, pero tu propia versión, tienes 250 caracteres", el resultado fue breve y directo [2:19]:

"Caperucita Verde llevaba pastel a su abuela."
"Un zorro astuto la engañó."
"La abuela y Caperucita se salvaron gracias a un leñador."

Cumplió el límite de caracteres y se apegó estrictamente a las instrucciones.

¿Qué cambia con temperatura alta?

Con temperatura en 1, el mismo prompt produjo una historia más desarrollada [3:02]: Caperucita Verde se volvió "una joven intrépida" con "manzanas doradas", el lobo fue retado con un acertijo y la historia terminó con risas. Además, no respetó el límite de 250 caracteres y generó dos imágenes en lugar de una.

Esto revela algo fundamental: la creatividad alta también implica que el modelo toma libertades con las instrucciones [3:50]. No solo innova en contenido, sino que decide ir más allá de lo que le pediste.

¿Cuándo usar cada nivel de temperatura?

Una buena regla práctica [4:30]:

Tareas que requieren precisión y consistencia: temperaturas bajas. Por ejemplo, analizar documentos legales o generar reportes financieros.
Tareas creativas: temperaturas altas. Títulos para videos, publicaciones en redes sociales, storytelling.
Casos intermedios: si necesitas crear una publicación de redes sociales basada en un artículo científico, ni el extremo bajo ni el alto funcionan. Hay que experimentar con valores medios [5:17].

¿Qué es Top P y en qué se diferencia de la temperatura?

El Top P se encuentra en la configuración avanzada de Google AI Studio [5:42] y controla el universo de palabras al que el modelo puede acceder para construir su respuesta. Recordemos que estos modelos predicen la siguiente palabra basándose en el modelo de atención y la ventana de contexto disponible [5:55].

Top P bajo: el modelo usa las palabras más probables y seguras. Menos variedad, más repetición.
Top P alto: accede a un vocabulario más amplio. Usa sinónimos, suena más sofisticado y diverso [6:12].

Con Top P en 0.05, el cuento fue prácticamente idéntico al de temperatura baja [6:30]. Pero con Top P en 1, el modelo se inventó un personaje llamado Luna, construyó diálogos y elaboró una narrativa mucho más rica [7:07].

¿Se pueden combinar temperatura y Top P?

Absolutamente. Aunque muchas guías recomiendan mover solo uno a la vez, la realidad es que combinarlos puede ser muy efectivo dependiendo del problema [7:50]. Con temperatura 0.05 y Top P 0.05, el resultado fue el más conservador de todos: corto, predecible y sin sorpresas [8:25].

Reportes y análisis: baja ambos valores para máxima precisión.
Trabajo creativo: sube ambos y ajusta según el resultado deseado.
Problemas mixtos: experimenta con combinaciones hasta encontrar el equilibrio.

Google AI Studio permite guardar cada versión y compararlas en el historial [8:50], lo que convierte este proceso en un laboratorio de pruebas donde puedes iterar rápidamente.

Ahora piensa en tu propio caso: ¿necesitas exactitud o creatividad? Prueba estos ajustes con un problema real y comparte en los comentarios qué configuración te funcionó mejor.

Comentarios

Gabriel Obregón

student•

🎯 Control de creatividad y consistencia en Google AI Studio

Ajusta las respuestas de Gemini manipulando dos controles clave: ✨ Temperatura y 🎚️ Top-P Ambos determinan cuánto varía el estilo, la precisión y la creatividad del modelo.

🔥 Temperatura = Nivel de creatividad

Piensa en ella como un termómetro:

🔹 Baja (≈ 0.05)

Precisión máxima.
Estructura y formato muy estables.
Ideal para análisis, reportes o textos técnicos.

📘 Ejemplo: cuento corto, directo, fiel a las reglas.

🔹 Alta (≈ 1)

Mayor libertad narrativa.
Puede ignorar límites o inventar detalles.
Perfecta para ideas creativas, storytelling o brainstorming.

🌈 Ejemplo: historia más expresiva, con nuevos giros y personajes.

💬 Top-P = Diversidad del lenguaje

Controla cuántas palabras posibles considera el modelo al escribir.

🔹 Bajo (≈ 0.05)

Palabras seguras y previsibles.
Frases simples, estilo directo.
Resultados más formales y uniformes.

🧱 Ejemplo: frases cortas, sin adornos.

🔹 Alto (≈ 1)

Más sinónimos, expresiones y matices.
Lenguaje fluido y natural.
Ideal para redacción creativa o expresiva. 🎨 Ejemplo: vocabulario variado y tono más sofisticado.

⚖️ Cómo equilibrar precisión y creatividad

🎯 Busca exactitud:

→ Temperatura baja + Top-P bajo

📊 Usos: reportes, leyes, textos científicos.

💡 Busca originalidad:

→ Temperatura alta + Top-P alto

✍️ Usos: ideas, historias, redes sociales.

🔸 Punto medio: Experimenta con valores intermedios si necesitas equilibrio (por ejemplo, divulgación o redacción profesional con toque humano).

📎 Consejo: Si partes de un texto base (PDF, ley, cita), mantén temperatura baja para no alterar la información.

Ivan Alberto Diaz Rivera

student•

Excelente resumen, me sirvio muchisimo!

Jose Edilbero Duran Forero

student•

Muchas gracias, me sirvió muchísimo! tu resumen te felicito.

Gregson Murcia Castro

student•

Este link me gusta como explica la temperatura y el top p

Renato Puello Pereira

student•

Gracias por el aporte, está genial y bien explicado!

Santiago García Rincón

student•

La diferencia entre usar un valor bajo de temperatura y un top-p bajo radica en cómo afecta la creatividad y precisión del modelo.

Temperatura baja (ej. 0.05): Provoca que el modelo genere respuestas muy consistentes y repetitivas, favoreciendo la seguridad en las respuestas. Esto es útil para tareas que requieren precisión.
Top-p bajo (ej. 0.05): Limita el conjunto de palabras que el modelo puede usar, restringiendo su creatividad y diversidad en el lenguaje, lo que también puede resultar en respuestas más predecibles.

En resumen, ambos controlan la precisión, pero lo hacen desde ángulos diferentes: la temperatura se enfoca en la creatividad, mientras que el top-p en la variedad léxica.

ALEJANDRO OLGUIN

student••

Para utilizar las configuraciones de temperatura y top P, estas se aplican al momento de hacer la solicitud a la API del modelo de lenguaje, no se configuran de manera permanente en la API key. Al enviar un prompt, debes incluir estos parámetros en el cuerpo de la solicitud. Asegúrate de ajustar estos valores según la tarea que deseas realizar, ya que influirán en la creatividad y precisión de las respuestas generadas.

Juan Camilo Mejía Rodríguez

student•

Clase muy útil porque aterriza que la “creatividad” del modelo se gestiona, no se reza. Me quedó clarísimo el rol de cada perilla: temperatura define cuánta variación se permite (baja = más consistencia y respeto a formato; alta = más libertad y riesgo de saltarse restricciones), y Top-P controla el “abanico” de palabras disponibles (bajo = vocabulario seguro y repetible; alto = más riqueza léxica y originalidad). El ejemplo de Caperucita con 250 caracteres lo demuestra perfecto: con temperatura alta el modelo se emociona… y se pasa de la raya.

Lo más valioso es el enfoque experimental: mismo prompt, mover extremos, comparar en historial y luego afinar a puntos medios según el objetivo (precisión vs ideación). Esto se siente como pasar de “prompting artesanal” a calibración profesional para outputs predecibles en entornos reales.

Brenda Alexandra Pérez Bedoya

student•

Bruno Salas Guzmán

student•

Pedí a Gemini hacer un ejemplo con temperatura 2.0 Prompt:

"¿Cuál es el país con menor índice de natalidad del mundo, y cuál es su pronóstico a 100 años?"

Temperatura: 2.0 (Caos Total / "Modo Alucinación")

"Corea del... Sur... índice bajo cero absoluto... bebés no... 0.72 algoritmos... nacen en el vacío...Pronóstico año 2100... la gente se vuelve polvo... estelar... no hay cunas, solo ecos... demografía líquida... system... futuro es una naranja mecánica... extinción suave... la tasa de fecundidad colapsa hacia la dimensión... error... ¿mañana?... población fantasma... Seúl es un bosque... data not found... silencio."

Henry Norberto Arias Salgado

student•

que bonito es el uso de google ai studio

Draxzlers van

student•

Super

Edgar Villatoro Pérez

student•

Resumen Gráfico by Napkin AI

Aaron Santillan

student•

La temperatura y el top-p son parámetros que afectan la creatividad y variabilidad de los resultados generados por modelos de lenguaje.

Temperatura: Controla la aleatoriedad de las respuestas. Valores bajos (cercanos a 0) producen resultados más consistentes y predecibles, mientras que valores altos (cercanos a 1) permiten respuestas más creativas y variadas.
Top-p (nucleus sampling): Limita el conjunto de palabras posibles a un porcentaje de probabilidad acumulativa. Un valor bajo restringe la variedad de palabras, mientras que un valor alto permite una mayor diversidad.

Usar ambos parámetros adecuadamente depende de la tarea y el equilibrio entre precisión y creatividad que se necesite.

Luis Felipe Ramirez Piraban

student•

Cómo puedo bajar la temperatura y top p en chat GPT o directo Gemini

Maria Camila Rodriguez Moreno

student•

Esta pregunta la puedes hacer en la cajita de preguntas, donde dice "Haz una pregunta a Juan"

De hecho ahí escribí tu pregunta y esto me respondió de manera inmediata:

La temperatura y el Top P son controles que puedes ajustar en herramientas como Google AI Studio para influir en la creatividad y consistencia de las respuestas de la IA.

Saludos, Maria CRM

Edwin Arévalo

student•

Tengo entendido que no se pueden ajustar esos parámetros directamente en los LLMs y lo más común es utilizar playgrounds web como OPENAI Playground, Google AI Studio, Anthropic Console, Vercel AI Playground, Perplexity Labs, entre otros. Aunque también se puede desde frameworks de desarrollo o entornos locales.

Mateo Montoya Henao

student•

✨ Resumen Visual de la Clase: Configuración de temperatura y Top-P en Google AI Studio ✨

1. La Idea Central (El Core 💡): La configuración de temperatura y Top-P influye en la creatividad y consistencia de los resultados generados por modelos de lenguaje.

2. Puntos Clave (En viñetas 📌):

Temperatura Baja (0.05): Resultados consistentes y predecibles, ideales para tareas que requieren precisión.
Temperatura Alta (1): Resultados más creativos y variados, útiles para contenido innovador.
Top-P Bajo (0.05): Limita el vocabulario, generando respuestas menos diversas.
Top-P Alto (1): Aumenta la variedad de palabras y la sofisticación en las respuestas.
Experimentación: Es vital ajustar ambos parámetros según la tarea a realizar.

3. El Ejemplo o Dato Crucial 🚀: Al configurar temperatura y Top-P, se pueden ver cambios drásticos en los resultados, desde un cuento básico hasta uno sofisticado y creativo.

4. Conexión o Siguiente Paso 🔗: Esta comprensión permite optimizar el uso de modelos de IA en diversos proyectos, ajustando las configuraciones según necesidades específicas.

Thiago Ferreira dos Santos

student•

el primer cuento me parece mucho mejor que el segundo en imagen, teniendo en cuenta que es un cuento para niños.

Diego Alejandro Muñoz Arcos

student•

¡Wow! 😍 Estas últimas dos clases me han volado la cabeza 🤯. He aprendido muchísimo sobre IA, mucho más de lo que esperaba. Me hace darme cuenta de lo importante que es seguir explorando y aprendiendo cada día 📚💡. Seguro que todo esto va a tener un impacto positivo en mi trabajo y en cómo uso la IA 🚀✨.

Omar Andrés Garzón C.

student•

Prompt: Genera un cuento que se parezca a la historia de Don quijote, pero con tu propia versión. Tienes 250 caracteres.

1. Temp: 0.05 y Top P:0.05

Alonso, harto de pantallas, salió con una tapa de olla por escudo. Vio en los drones dragones y en el metro, un gusano de metal. Su vecino Sancho le seguía con el botiquín. "¡Por la justicia!", gritaba desafiando a un semáforo en rojo.

2. Temp: 1 y Top P: 1

Don Alonso, harto de conspiraciones, creyó ser un hacker místico. Con su teclado viejo y su vecino, salió a enfrentar "gigantes": antenas 5G. "¡Ríndanse, espías!", gritaba al caer de su silla. La realidad, aburrida, solo lo volvió un meme.

Elena Octavia Mihalache

student•

ajajaja

EDUARDO ARNOLDO AGUILAR CAÑAS

student•

Me parece curioso que la mayoría de opciones apuntaron al color verde, siendo rojo el color originalmente mencionado en el cuento y el prompt. Tendrá que ver con la similitud del embedding ?

Gregson Murcia Castro

student•

Tambien viendo modelos open source con Ollama hay otros como

top_k: usar palabras mas conservadoras (mas probable) vs diversas

Nicolás Arana Riaño

student•

Me fue muy bien. Fue muy útil y logré tener diferentes respuestas o soluciones.

MARIA ELENA LOPEZ GOMEZ

student•

Ejemplo de Temperatura 2.0 (Caos Creativo / Delirio Algorítmico)

Prompt:

"¿Qué pasará con Venecia si el nivel del mar sube 5 metros por el cambio climático, y cuál es el plan de contingencia extremo?"

Temperatura: 2.0 (Modo Entropía Máxima / Flujo de Conciencia Roto)

Respuesta del Modelo:

"Venecia... góngolas... no, góndolas de neón líquido... el Adriático tiene dientes de sal... 5 metros son 500 centímetros de suspiros inundados... las plazas no flotan, beben... San Marcos es un acuario para ángeles de mármol... ¿El plan? Proyecto MOSE... error de desbordamiento... compuertas de titanio cuántico... las palomas aprenden a brillar bajo el agua... Pronóstico... Venecia no se hunde, se deslocaliza en la nube... servidores sumergidos... píxeles húmedos... la arquitectura es ahora un fluido no newtoniano... el Dux es un algoritmo de coral... stop... sin tierra, solo código marítimo... el mapa se derrite en la taza de café del programador... 404: Atlantis Encontrada... fin de la transmisión."

¿Por qué se lee así? (Detrás del caos)

Asociación libre descontrolada: En temperatura normal, "Venecia" se asocia con "canales" o "turismo". En 2.0, el modelo salta de "góndolas" a "góngolas" (un error tipográfico nativo del caos), luego a "neón líquido" y de ahí a "píxeles húmedos".
Glitch de contexto: Mezcla el problema físico real (el Proyecto MOSE, que son las barreras flotantes de Venecia) con conceptos de informática ("error de desbordamiento", "servidores sumergidos") porque el modelo empieza a confundir su propia naturaleza de IA con el tema del que está hablando.
Poesía apocalíptica involuntaria: Frases como "las palomas aprenden a brillar bajo el agua" ocurren porque estadísticamente esas palabras casi nunca van juntas, lo que para la IA matemática es el equivalente a "pensar fuera de la caja".

Andrés Ricardo Cristancho Jiménez

student•

¿Cuándo debería bajar la temperatura del modelo?

Debes reducir este valor cuando tu prioridad absoluta sea la precisión y la consistencia. Imagina que estás configurando a la inteligencia artificial en un "modo analítico estricto". Si estás extrayendo datos de un reporte financiero, redactando un contrato legal o generando bloques de código, no quieres que el modelo invente cosas o se ponga creativo. Al acercar el valor a 0.0, le quitas la libertad de improvisar y lo obligas a tomar el camino lógico más predecible. Esto garantiza que si ejecutas el mismo prompt diez veces, obtendrás prácticamente la misma respuesta exacta cada vez, evitando alucinaciones o parafraseos innecesarios que podrían arruinar un documento técnico. Es la configuración ideal para automatizar procesos donde el margen de error debe ser nulo.

Fundamentos prácticos de la IA generativa

Estructura de prompts que eliminan respuestas genéricas

Cómo crear el prompt perfecto con ChatGPT

Qué son los embeddings en los LLMs

Rol en prompts: cómo mejorar respuestas de IA

Estructurando instrucciones claras y efectivas

ChatGPT vs Claude vs Gemini cuál elegir

Zero-shot vs few-shot en prompts

Etiquetas XML para estructurar prompts

Manejo de contexto extenso y datos

Ventana de contexto y tokens en LLMs

Grounding para evitar que la IA invente leyes

Chain of thought y self-consistency en LLMs

Tecnicas de razonamiento para tareas complejas

Modelos de razonamiento de ChatGPT y cadenas de pensamiento

Prompt chaining como línea de ensamblaje

Playgrounds de IA para escalar tus prompts