Contenido del curso

Fundamentos prácticos de la IA generativa

Estructurando instrucciones claras y efectivas

Manejo de contexto extenso y datos

Tecnicas de razonamiento para tareas complejas

Aplicaciones y automatización profesional

Cómo crear prompts de imagen en ChatGPT

Resumen

Pedirle a la inteligencia artificial que genere "una oficina moderna" puede darte un resultado genérico que no se parece en nada a lo que tenías en mente. La diferencia entre una imagen predecible y una que refleje exactamente tu visión está en cómo describes la escena. Dominar la estructura de un prompt para generación de imágenes es una habilidad que transforma resultados mediocres en creaciones precisas y profesionales.

¿Por qué un prompt vago produce imágenes genéricas?

Cuando escribes instrucciones como "genera una imagen de una oficina moderna", el modelo interpreta esas palabras con la referencia más común que tiene en sus datos de entrenamiento [0:08]. El resultado será algo ordenado, limpio y estándar, pero quizás tú imaginabas un open space caótico al estilo de las oficinas de Facebook o Google.

La analogía es simple: imagina que estás en una escena y hablas por teléfono con alguien para que se la imagine [0:42]. Si solo dices "estoy en una oficina", esa persona pensará en cualquier oficina. Pero si describes los monitores, las plantas, la gente moviéndose, el ruido, entonces la imagen mental será mucho más cercana a la tuya. Ser descriptivo es ser preciso.

Otra forma de entenderlo: no es lo mismo decir "tráeme ese vaso de la cocina" que decir "tráeme el vaso azul que está al lado del microondas" [1:17]. Ambas instrucciones podrían funcionar, pero solo la segunda garantiza que recibirás exactamente lo que esperabas.

¿Cuáles son los tres componentes de un prompt efectivo para imágenes?

La clave está en descomponer la escena en tres partes [0:55]: el protagonista, el estilo visual y la composición.

¿Cómo describir al protagonista?

No digas "un perro grande". Describe al golden retriever con collar rojo, estatura mediana, que parece tener dos años y es juguetón [1:02]. Cada detalle que agregas reduce la ambigüedad y acerca el resultado a lo que realmente quieres. Cuanto más específico seas con el sujeto principal de tu imagen, menos margen de interpretación le dejas al modelo.

¿Qué significa definir el estilo visual?

Piensa en el estilo visual como un filtro de Instagram [1:42]. Pregúntate: ¿quieres una foto realista tomada con un celular? ¿Una caricatura? ¿Un personaje al estilo Disney? ¿Una foto con apariencia vintage? Es como elegir el outfit para una ocasión [2:05]: no es lo mismo ropa de ejercicio que un traje formal con corbatín. Describir colores, texturas y el tipo de representación gráfica le da vida a tu imagen.

¿Cómo componer la escena como un director de fotografía?

Imagina que eres el director de fotografía de tu propia película [2:27]. Define desde qué ángulo se toma la foto: ¿a nivel de mesa o desde la esquina del cuarto para capturar a todas las personas? [2:33]. Considera la iluminación: ¿la luz entra por la ventana o son luces blancas de techo que hacen ver todo muy despierto? [2:44].

La atmósfera se crea a partir de los detalles. Si mencionas una cafetería, cada persona imaginará la más cercana a su casa. Pero si agregas que la tetera está sacando humo y nublando la vista [3:10], de repente esa imagen genérica se transforma en algo específico y evocador.

¿Cómo se aplica esto en un ejercicio práctico con ChatGPT?

En lugar de escribir "personas trabajando", un prompt más elaborado sería: "Genera una imagen de cuatro profesionales diversos colaborando alrededor de una mesa redonda con laptops y documentos" [3:34]. Eso define al protagonista. Luego se añade el estilo: fotografía corporativa moderna [3:46]. Finalmente, la composición: vista de un ángulo de 45 grados con luz natural de oficina [3:52].

El resultado será mucho más cercano a lo esperado. Y si no es perfecto a la primera, funciona como cocinar: vas probando, dando feedback específico sobre lo que no salió bien [4:05]. Un consejo valioso es que, una vez que llegues a la imagen deseada, le preguntes al modelo cuál hubiera sido el prompt ideal para generarla desde el inicio [4:16].

Un último punto fundamental: no seas contradictorio en tus instrucciones [4:22]. Pedir una foto realista con estilo de caricatura confunde al modelo y produce resultados incoherentes, como pedirle a alguien que cante a todo volumen pero en voz baja [4:38].

Comentarios

Kenneth Angulo L

student•

Genera la imagen de un gato amarillo sentado en una silla de escritorio de color negro, programando frente a la pantalla de un computador. El computador es grande de formato torre se encuentra ubicado a la izquierda del escritorio y sobre la mesa del escritorio se encuentra el monitor descentrado hacia la derecha. Sobre el escritorio se observa también un parlante bluetooth, un vaso con jugo de guayaba y un pequeño portalápices estilo barril de cerveza de un barco unido que contiene marcadores de colores.

Al fondo de la imagen se observa una ventana del mismo ancho del escritorio donde se observa la ciudad (edificios lejanos y arboles al atardecer, son las 5:30 pm). alcanza a verse la pared del lado izquierdo donde se observa un poster alusivo a la música country

Jorge Guzman Suir

student••

Wow. El estilo de Lo-fi girl

Alvaro Reyes

student•

Me encantó

Luis Narvaez

student••

Godzilla Rezando

Carlos Andres Romero Cruz

student•

Me gustó mucho el resultado de tu prompt

Miguel Bastidas

student•

Esto es el hermoso santuario de las Lajas en Pasto, Nariño.

Gabriel Obregón

student•

✨ Cómo escribir prompts efectivos para generar imágenes en ChatGPT

🧠 Idea central

Cuanto más clara y detallada sea tu descripción, más precisa será la imagen que obtendrás. Habla como si describieras la escena por teléfono.

🔶 Estructura básica del prompt

💬 Divide tu descripción en 3 partes:

1️⃣ 🎭 Protagonista → quién o qué aparece

2️⃣ 🖼️ Estilo visual → cómo se ve

3️⃣ 💡 Composición e iluminación → desde dónde y con qué luz

🎭 1. Protagonista

🎯 Objetivo: mostrar claramente quién es el sujeto principal.

🔹 Usa descripciones específicas y detalladas.

🔹 Piensa en características físicas, objetos, colores o emociones.

💬 Ejemplo:

❌ “Un perro grande” ✅ “Golden retriever de dos años, tamaño mediano, con collar rojo, muy juguetón.”

🔑 Analogía:

No digas “tráeme un vaso de la cocina”, di “tráeme el vaso azul que está al lado del microondas.”

✨ Beneficio: claridad total → resultados más exactos.

🖼️ 2. Estilo visual

🎯 Objetivo: definir la estética general de la imagen.

🎨 Elige el “look” que buscas:

Fotografía realista
Caricatura o ilustración tipo Disney
Foto vintage
Render 3D
Estilo cinematográfico

🎨 Añade detalles:

Colores predominantes
Texturas y materiales
Sensación o atmósfera

💬 Ejemplo:

❌ “Ropa de ejercicio”

✅ “Traje formal con corbatín y camisa azul oscuro.”

💡 Clave: el estilo es lo que da vida y coherencia visual a la imagen.

💡 3. Composición e iluminación

🎯 Objetivo: decidir cómo se muestra la escena.

🎥 Piensa como un director de fotografía:

¿Desde dónde se ve la cámara? (frontal, lateral, aérea)
¿Qué tipo de luz hay? (natural, cálida, blanca, tenue)
¿Qué sensación transmite la escena?

☕ Ejemplo visual:

“Una cafetería con luz natural, el agua hierve y la tetera suelta vapor que nubla ligeramente la vista.”

📸 Resultado: Una escena con punto de vista claro, atmósfera coherente y contexto creíble.

🧩 Ejemplo completo de prompt

❌ “Personas trabajando.”

✅ “Cuatro profesionales diversos colaborando alrededor de una mesa redonda con laptops y documentos, en estilo de fotografía corporativa moderna, con una vista desde un ángulo de 45 grados y luz natural de oficina.”

🎯 Incluye las tres piezas: protagonista + estilo + composición/iluminación.

🔁 Cómo mejorar tus prompts

Piensa en el prompting como una receta:

1️⃣ Prueba un prompt

2️⃣ Evalúa el resultado

3️⃣ Ajusta los detalles

4️⃣ Pregunta:

“¿Cuál habría sido el prompt ideal para obtener esta imagen desde el inicio?”

🍳 Practica → aprende → perfecciona.

⚠️ Errores comunes que debes evitar

🚫 Contradicciones: “foto realista” + “caricatura”

🚫 Instrucciones imposibles: “cantar fuerte pero en voz baja”

🚫 Falta de detalle: sin sujetos, sin luz, sin estilo

🚫 Suposiciones: “oficina moderna” puede ser mil cosas distintas

✅ Consejo: sé específico, coherente y visual.

Tomas Carrasco Fuentes

student•

Nadia Jael Ramirez Pareja

student•

buenisimo

Joan Marcel Quintana

student•

Prompt ideado para Gemini Nano 🍌:

"Una persona con un disfraz detallado de El Lorax. La persona debe llevar una licra o traje corporal completo de color naranja brillante que cubra el torso, brazos y cabeza, actuando como la piel del personaje. Sobre la cabeza debe llevar un gorro o balaclava naranja a juego. Las cejas son gruesas y pobladas de color amarillo canario intenso. La persona no lleva el bigote grande, frondoso y colgante de color amarillo canario intenso. Se está quitando las cejas amarillas prostéticas del rostro. El resto del rostro visible (ojos, nariz, parte de las mejillas y boca) debe mantener la tonalidad natural de la piel de la persona o un maquillaje base sutil que respete sus contornos faciales y rasgos individuales, incluyendo la forma de sus ojos, nariz y boca. Asegúrate de que los rasgos faciales originales (ojos, nariz, boca) de la persona sean claramente visibles y se mantengan sin distorsión, para que el disfraz parezca aplicado sobre la persona en lugar de reemplazarla. Se debe apreciar la expresión facial del sujeto a través del maquillaje y los accesorios."

Resultado:

Carlos Andres Romero Cruz

student•

Genial!

Gera Meraki

student•

Curiosidades: Que interesante como nunca le pase el logo de Platzi y fue a buscarlo para colocarlo en la camisa, me encanto el resultado.

Mi prompt: Ayudame a generar una imagen que cumpla con los siguientes requisitos:   Contexto de la imagen: Un gatito esta grabando un curso, tiene puesta una camisa que tiene el logo de Platzi, tiene delante de el su computadora, el fondo esta iluminado de un color rosa claro, y de lado derecho tiene una lampara con tres luces. El gato usa lentes que lo hacen ver como un felino inteligente. Necesito que la toma de la imagen sea en un aspecto 1080/720, que se vea como si la cámara esta justo delante del gato y a su altura.

ALEJANDRO OLGUIN

student••

genera una imagen de un desarrollador sentado en su escritorio tomando un curso de prompt engineering en platzi, en su escritorio tiene su laptop a la izquierda y al frente esta su segunda pantalla con su teclado, su escritorio tiene parte superior que es como repisa para libros y algunos adornos. Genera una imagen realista desde un celular, una iluminacion calida que tranmita la tranquilidad que siente al sentir que esta aprendiendo, esta con una semideportiva, comoda sentado frente a su computador. La camara esta desde la diagonal trasera.

Ulqernesh Karvenae

student•

Luis Narvaez

student••

Impresionante!!!!!

Oscar Garcia

student•

Genera una imagen de un metalero con cabello largo, de perfil, con una cabellera y que se pueda leer Metallica. Este metalero, debe tener al lado unas bocinas gigantescas donde se pueda ver que está escuchando el album negro de metallica. Debe ser estilo animé y el metalero debe estar feliz.

Luis Narvaez

student•

Eligió el Black Album 🤘

Joel Duarte

student•

Ricardo Arquimedes Castro Quintero

student•

Francisco Jesús Eslava Fernández

student•

excelente

Francisco Antonio Rotundo Perez

student•

"Crea un imagen de Silver surfer con su tabla plateada, usando shorts Hawaianos. El surfista va agarrando la ola de frente es decir el esta con el cuerpo de frente a la ola, es una ola tubular, extremandamente hueca, y el surfista va en ese momento dentro de la ola, es una ola bastante cristalina, y se nota el fondo que tiene muchos corales. Esta es una ola que se arma hacia la izquierda si la ves desde la orilla originada por la corriente que choca con un malecon"

Juan Miguel Jimenez

student•

Ilustración digital en vista isométrica desde arriba de un desarrollador de software moderno trabajando en una habitación limpia y minimalista con paredes azules. El desarrollador está sentado en un escritorio blanco elegante escribiendo en una laptop, rodeado por tres monitores ultra anchos que muestran código colorido y paneles de control. El entorno está muy iluminado con luz proveniente del techo (sin lámpara de escritorio). En la pared detrás hay dos cuadros con frases motivacionales que dicen “WORK HARD & MAKE IT HAPPEN” y “NEVER STOP LEARNING”. Sobre el escritorio hay un teléfono inteligente, un mouse, cuadernos y una lata de bebida energética “XS” en lugar de café. Sombras digitales suaves, estilo de ilustración limpio y detallado, ambiente moderno y profesional.

Franklin Jhoel Purihuamán callaca

student•

GEMINI _ NANO BANANA

GENERA UNA IMAGEN DONDE UNA PERSONA DE 18 AÑOS ESTA PEROSNA LLEVA UN POLO VERDE ,SHORT NEGRO, ANTEOJOS Y UNOS AUDIFONOS,

ESTE ESTA SENTADO FRENTE A UNA COMPUTRADORA,EN EL COMPUTOR SE MUESTRA UN CLASE DE UN CURSSO DE PROMPT EGINEERIGN DE PLATZI, EN SU ESCRITORIO HAY LIBROS Y CUADERNOS DE APUNTES Y SU CELULAR DOND ESTA SONANDO MUSICA,SE MOSTRARA UN POCO DE SU CAMA.

DEBERAS HACERLA EN UN ESTILO REALISTA,TOMADO DESDE UN IPHONE 17 PRO MAX

TOMADA DESDE EL LADO DERECHO,, LA LUZ ENTRA POR ESE MISMO LADO, EL FORMATO DEBERA SER 9:6

Jorge Guzman Suir

student•

Este es mi intento de la clase. Me describí lo mejor posible e incluí los detalles más destacados de donde estoy. Es muy cercano pero le fallaron algunos detalles. Utilice Google AI Studio/ nano banana.

Maria Constanza Franco

student•

Genera una imagen realista de una mujer de 35 años participando de una clase online de platzi. Esta usando una laptop hp color azul oscuro de 14 pulgadas y esta conectada a un monito AOC de 32 pulgadas en dónde proyecta los videos de la clase. El cuarto en dónde se encuentra tiene un piso en madera laminada de bambú color marron claro y el escritorio en dónde se encuentra es color blanco. Las paredes y los muebles también son color blanco, incluyendo la silla de escritorio que es estilo ejecutiva. La mujer tiene cabello color castaño y esta recogido, ella usa audífonos over era de sony y los tiene conectados a la computadora por cable. Tiene una libreta de apuntes tamaño A5 junto con un lapicero retráctil. Esta vestida con una camiseta color negro manga corta y un pantalón negro. Usa tenis adidas blancos.

Tomas Carrasco Fuentes

student•

Luis Narvaez

student•

Guillermo Escalona Olivares

student•

Buenisima, el estilo como si estuviera usando un lente de tipo shift

Laura Daniela Lasso Arciniegas

student•

Genera una imagen en estilo animacion, es un dibujo desde la puerta del cuarto ubicado en la esquina derecha, desde el marco de la puerta se puede ver al fondo una cortina dorada que cubre la ventana, en medio de la habitacion se encuentra una cama que ocupa casi toda la habitacion, en la cama se encuentra un chica con una pijama beige, escribiendo en su laptop, con una table a su derecha, en la esquina de la cama se encuentra un gato gris con blanco durmiendo. La luz que ilumina la habitacion proviene de una lampara con luz calida.

Miguel Villa

student•

Fotografía hiperrealista de una oficina moderna tipo open space, con diseño contemporáneo en madera, vidrio y plantas naturales, iluminación matutina suave entrando por ventanales de piso a techo, con vista urbana.

La escena debe mostrar alta actividad laboral: varias personas trabajando en computadoras en sus escritorios, otras caminando por los pasillos, conversando o desplazándose, transmitiendo dinamismo y productividad.

Todos los empleados visten chalecos o chamarras negras, con un logotipo blanco minimalista en el pecho y la espalda con las iniciales “IA”.

Toma realizada con lente gran angular (wide angle) para capturar el mayor número de personas y profundidad del espacio.

Estilo fotografía corporativa premium, realista, enfoque nítido, profundidad de campo equilibrada, composición limpia, atmósfera profesional y moderna, alta resolución, calidad editorial.

Tip extra (importante)

Si la herramienta lo permite, agrega parámetros como:

wide angle lens
morning light
corporate photography
realistic people
high activity office

Si quieres, puedo:

Optimizarlo específicamente para Gemini
Adaptarlo a Midjourney (con parámetros)
Ajustarlo para un look más cinematográfico o más corporativo institucional

Fundamentos prácticos de la IA generativa

Estructura de prompts que eliminan respuestas genéricas

Cómo crear el prompt perfecto con ChatGPT

Qué son los embeddings en los LLMs

Rol en prompts: cómo mejorar respuestas de IA

Estructurando instrucciones claras y efectivas

ChatGPT vs Claude vs Gemini cuál elegir

Zero-shot vs few-shot en prompts

Etiquetas XML para estructurar prompts

Manejo de contexto extenso y datos

Ventana de contexto y tokens en LLMs

Grounding para evitar que la IA invente leyes

Chain of thought y self-consistency en LLMs

Tecnicas de razonamiento para tareas complejas

Modelos de razonamiento de ChatGPT y cadenas de pensamiento

Prompt chaining como línea de ensamblaje

Playgrounds de IA para escalar tus prompts

Temperatura y Top P en Google AI Studio

Aplicaciones y automatización profesional