Prompts descriptivos para generar imágenes en ChatGPT

Resumen

Generar imágenes con inteligencia artificial parece simple hasta que el resultado no coincide con lo que tenías en mente. Aprender a escribir un prompt descriptivo en ChatGPT es la diferencia entre una imagen genérica y una escena que refleja exactamente lo que imaginas, y aplica para cualquier persona que use modelos generativos para crear contenido visual.

Por qué un prompt genérico falla al generar imágenes

Cuando le pides a ChatGPT "genera una imagen de una oficina moderna", el modelo entrega su interpretación promedio: algo ordenado, limpio y predecible [0:14]. Pero si tú imaginabas el caos creativo de un open space tipo Facebook o Google, el resultado se queda corto.

La razón es simple: el modelo no puede leer tu mente, solo tu texto. Por eso, escribir un prompt es como hablar por teléfono con alguien que no ve lo que tú ves. Necesitas describir la escena con tanto detalle que la otra persona pueda reconstruirla mentalmente sin equivocarse.

¿Qué es un prompt en inteligencia artificial? Es la instrucción de texto que le das a un modelo como ChatGPT para que genere una respuesta o una imagen. Cuanto más específico sea, más cercano será el resultado a lo que esperas.

Cuáles son las tres partes clave de un buen prompt visual

La fórmula consiste en descomponer la escena en tres bloques: protagonista, estilo visual y composición [1:30]. Cada uno cumple una función distinta y juntos le dan al modelo suficiente contexto para acertar.

Cómo describir al protagonista con suficiente detalle

No escribas "un perro grande". Escribe "un golden retriever con collar rojo, estatura mediana, aproximadamente dos años de edad y muy juguetón" [1:40]. La diferencia es la misma que hay entre pedir "tráeme un vaso de la cocina" y pedir "tráeme el vaso azul que está al lado del microondas".

Con la primera instrucción, el resultado es azaroso. Con la segunda, es certero. Mientras más atributos concretos incluyas (color, tamaño, edad, actitud, accesorios), más control tienes sobre la salida.

Qué es el estilo visual y cómo definirlo

Piensa en el estilo visual como un filtro de Instagram aplicado a tu escena [2:30]. ¿Quieres una foto realista tomada con celular? ¿Una caricatura? ¿Un personaje estilo Disney? ¿Una foto vieja con grano? Cada opción cambia por completo el resultado.

Es como elegir el outfit para una boda: no es lo mismo decir "ropa de ejercicio" que describir un traje formal con corbatín, camisa específica y los colores exactos. El estilo visual es lo que le da vida y personalidad a la imagen.

Cómo trabajar la composición de la escena

Aquí actúas como director de fotografía [3:30]. Define el ángulo de la cámara, la altura de la toma y la iluminación.

  • Ángulo: ¿la foto está al nivel de la mesa o desde la esquina del cuarto?.
  • Iluminación: ¿luz natural entrando por la ventana o luz blanca intensa de techo?.
  • Atmósfera: detalles ambientales como humo, niebla o reflejos que añaden profundidad.

Si yo te digo "cafetería", imaginas la más cercana a tu casa. Pero si agrego "la tetera está hirviendo y el humo nubla todo lo que ves" [4:25], la imagen mental cambia por completo. Los detalles construyen la atmósfera.

Cómo se ve un prompt elaborado en la práctica

Una versión básica como "personas trabajando" cae en el mismo error inicial: es demasiado abierta. Un prompt elaborado, en cambio, integra los tres componentes [5:00]:

Genera una imagen de cuatro profesionales diversos colaborando alrededor de una mesa redonda con laptops y documentos, en estilo de fotografía corporativa moderna, con una vista en ángulo de 45 grados y luz natural de oficina.

Ahí tienes protagonista (cuatro profesionales diversos con objetos específicos), estilo (fotografía corporativa moderna) y composición (ángulo de 45 grados, luz natural).

¿Qué hago si la imagen no salió como esperaba? Trátalo como cocinar: prueba, da feedback específico sobre qué no funcionó y ajusta. También puedes pedirle al modelo cuál hubiera sido el prompt ideal para ese resultado.

Por qué evitar instrucciones contradictorias en tus prompts

Un error frecuente es combinar atributos que se cancelan entre sí. Pedir "una foto realista con estilo de caricatura" confunde al modelo y dispara las llamadas alucinaciones, donde la inteligencia artificial entrega resultados extraños porque no sabe qué priorizar [6:15].

Es como pedirle a alguien que cante a todo volumen pero en voz baja: no tiene sentido lógico. Decide entre estilos opuestos antes de escribir el prompt y mantén coherencia entre el protagonista, el estilo y la composición.

¿Qué es una alucinación en IA generativa? Es cuando el modelo produce un resultado incoherente o inventado porque recibió instrucciones ambiguas o contradictorias.

Ahora te toca a ti: déjame en los comentarios una imagen generada con ChatGPT de la escena en la que estás tomando la clase ahora mismo, junto con el prompt que usaste.