Creación de prompts detallados para generación de imágenes con IA

Clase 15 de 18Curso de Prompt Engineering

Resumen

Pedir “Genera una imagen de una oficina moderna” en ChatGPT 5, modelo auto, puede entregarte algo muy distinto a lo que tenías en mente. La diferencia está en cómo construyes el prompt. Aquí vas a aprender a describir la escena como si estuvieras allí, para guiar al modelo y obtener imágenes precisas y con intención.

¿Cómo escribir prompts efectivos para imágenes en ChatGPT?

La clave es ser tan descriptivo como si hablaras por teléfono y quisieras que la otra persona imagine exactamente tu escena. Para lograrlo, descompón el prompt en tres partes: protagonista, estilo visual y composición.

¿Qué es el protagonista en el prompt?

  • Describe sujetos concretos con rasgos específicos.
  • Ejemplo útil: no “un perro grande”, sino “un golden retriever con collar rojo, mediana estatura, dos años, muy juguetón”.
  • Analogía clara: no digas “tráeme un vaso de la cocina”, di “tráeme el vaso azul que está al lado del microondas”.
  • Beneficio: reduce la ambigüedad y aumenta la probabilidad de obtener lo que esperas.

¿Cómo definir el estilo visual?

  • Piensa en filtros de Instagram: foto realista de celular, caricatura, personaje de Disney, foto vieja, tomada con iPhone.
  • Especifica paleta y texturas: colores, materiales, sensaciones.
  • Analogía del outfit: no “ropa de ejercicio” si buscas formalidad, sino “traje formal con corbatín y camisa”.
  • Clave: el estilo visual da vida a la imagen y alinea expectativas.

¿Cómo decidir la composición e iluminación?

  • Asume el rol de director de fotografía: ¿nivel de mesa o vista desde la esquina del cuarto para ver a todos y sus expresiones?
  • Define la iluminación: luz entrando por la ventana, o luces de techo blancas e intensas que hacen ver todo “despierto”.
  • Ubica la “cámara” y crea atmósfera con detalles: en la cafetería, el agua hierve y la tetera suelta humo que nubla la vista.
  • Resultado: una escena con punto de vista claro y contexto creíble.

¿Qué ejemplo de prompt ilustra protagonista, estilo y composición?

Un punto de partida vago sería “personas trabajando”. Para evitar el error, integra las tres partes:

  • Protagonista: “cuatro profesionales diversos colaborando alrededor de una mesa redonda con laptops y documentos”.
  • Estilo visual: “fotografía corporativa moderna”.
  • Composición e iluminación: “vista de un ángulo de 45 grados con luz natural de oficina”.

Ejemplo integrado:

“Genera una imagen de cuatro profesionales diversos colaborando alrededor de una mesa redonda con laptops y documentos, en estilo de fotografía corporativa moderna, con una vista de un ángulo de 45 grados y luz natural de oficina.”

Luego, itera como si estuvieras cocinando: prueba, evalúa y da feedback específico sobre lo que no salió bien. Cuando llegues al resultado esperado, pide: “¿Cuál hubiera sido el prompt ideal para lograr esta imagen desde el inicio?”. Así mejoras tu próximo intento con base en el propio resultado.

¿Qué errores comunes debes evitar al hacer prompting?

Ser contradictorio confunde al modelo y provoca alucinaciones. Evita instrucciones incompatibles.

  • No combines “foto realista” con “estilo de caricatura”.
  • No mezcles demandas imposibles: como “cantar a todo volumen, pero en voz baja”.
  • No dejes cabos sueltos: especifica sujetos, estilo, punto de vista e iluminación.
  • No des por sentado lo “obvio”: “oficina moderna” puede ser un open space caótico o un espacio minimalista y ordenado.

Comparte en comentarios una imagen generada con ChatGPT de la escena donde estás ahora, junto con el prompt que usaste.