Anatomía de un prompt para imágenes con IA

Curso de Generación de Imágenes con Inteligencia Artificial

Contenido del curso

Creación de Imágenes y la Inteligencia artificial

Práctica con Modelos de IA

Prototipado y marketing de productos

Innovando e iteración de productos con IA

Innovando e incorporación en flujos de producción

Futuro y cierre

24
IA para fotos de producto por dos centavos
02:11 min

Tomar examen

Anatomía de un prompt para imágenes con IA

Resumen

Crear imágenes impactantes con Stable Diffusion o Flux no depende solo del modelo, depende de cómo escribes el prompt. Aquí aprendes la anatomía de un prompt efectivo para que tus resultados dejen de verse genéricos y empiecen a parecerse a esa imagen que tienes en la cabeza.

¿Por qué un prompt no es lo mismo que una idea?

Cuando hablas con ChatGPT pides cosas en abstracto: "hazme una tabla", "explícame esto". Pero los modelos de imagen como Flux o Stable Diffusion no funcionan igual. Ellos no interpretan deseos, interpretan descripciones estructuradas.

El camino siempre es el mismo: pasas de una idea, a una descripción, a un prompt.

Mira el contraste. Tu idea puede ser "un viajero en una montaña en el futuro". Eso, suelto, le dice muy poco al modelo. La descripción ya añade detalle: "un viajero con una mochila viendo una ciudad futurista a lo lejos sobre el filo de una montaña". Y el prompt final lo lleva a otro nivel: "un viajero solitario con una mochila de trekking de pie al borde de una montaña, observando una ciudad futurista que brilla con luces de neón, drones volando en el cielo, fusionando estéticas solarpunk y cyberpunk, con iluminación dramática y atmósfera cinematográfica".

¿Qué es un prompt para generar imágenes? Es una descripción precisa y estructurada de la escena que quieres crear. No es un deseo ni una idea suelta, es una instrucción detallada con sujeto, contexto, elementos visuales y estilo.

¿Cuál es la estructura de un buen prompt para imágenes?

Un prompt sólido se construye sobre cuatro bloques. Si te falta alguno, el modelo improvisa, y ahí es donde aparecen esas imágenes "normales" que no terminan de convencerte.

Sujeto principal y ángulo de visión

Es el quién o el qué de la imagen. Aquí defines características concretas: tipo de objeto, color, figura, texto si lo lleva. Si es un carro, ¿qué tipo? Si es una persona, ¿cómo está vestida?

Después viene el ángulo de visión. No es lo mismo un plano aéreo desde la montaña que un primer plano de una mano con un anillo. Define desde dónde se ve la escena.

Contexto y entorno

Aquí ubicas al sujeto en un lugar y le das un mood. Incluye:

Ubicación y paisaje, como una montaña, una ciudad o un interior arquitectónico.
Ambiente espacial, es decir, dónde sucede la escena.
Atmósfera y estado de ánimo, por ejemplo melancólico, nocturno, al atardecer o cinematográfico.

Un mismo sujeto cambia por completo según el contexto que lo rodea.

Elementos visuales y estilo

Los elementos visuales suman colores, texturas e iluminación. Tonos cálidos de atardecer, textura rugosa de corteza, luz suave, sombras marcadas, iluminación dramática.

El estilo y estética cierran el prompt. Aquí decides si quieres acuarela, arte digital, fotorrealismo o anime de los 90. Puedes apoyarte en influencias artísticas concretas como Van Gogh o Beksinski para guiar la dirección visual.

¿Por qué importa el orden de los elementos en el prompt? Porque el modelo interpreta jerarquía según la secuencia. Si cambias el orden, cambian los resultados. Por eso conviene iterar: prueba, mueve un elemento y compara qué pasa.

¿En qué idioma debo escribir mis prompts?

Puedes escribirlos en español, pero la recomendación es escribirlos en inglés. La mayoría de modelos de imagen están optimizados para inglés, y muchas empresas lanzan sus primeros features solo en ese idioma. Apple Intelligence, por ejemplo, arrancó disponible únicamente con Siri en inglés.

Si te sientes más cómodo pensando en español, hay un truco simple: escribe tu prompt completo en español y pídele a ChatGPT que lo traduzca a inglés. Le pasas el prompt largo, le dices "traduce este prompt a inglés" y lo usas en Flux o Stable Diffusion.

Un detalle práctico: dependiendo del modelo y de si lo pagas o no, puede que el prompt sea demasiado largo y exceda los tokens disponibles. En ese caso toca optimizar y recortar para que entre dentro del límite del modelo.

¿Cómo se ve un prompt completo, desglosado?

Volvamos al ejemplo del viajero, ahora separado por bloques:

Sujeto principal: un viajero solitario con una mochila de trekking de pie al borde de una montaña, observando una ciudad futurista que brilla con luces de neón, drones volando en el cielo.
Estilo y estética: fusión de estéticas solarpunk y cyberpunk.
Contexto y entorno: una ciudad vibrante, con vegetación integrada en arquitectura avanzada, paneles solares y tecnología elegante.
Elementos visuales: contraste entre paisaje natural y entorno urbano de alta tecnología, iluminación dramática y atmósfera cinematográfica.

Cuando juntas los cuatro bloques, el modelo deja de adivinar y empieza a construir exactamente lo que tienes en mente.

¿Con qué tipo de imágenes deberías practicar primero?

Antes de saltar a productos comerciales, conviene practicar con escenarios de fantasía e imaginación. Describir escenas complejas te entrena el músculo de la estructura, y eso después se traduce en mejores fotos de producto cuando llegues al terreno comercial.

Un par de variables extra para sumar a tu práctica son la acción del sujeto y la composición de la imagen. Juega con ellas, mueve el orden, cambia el estilo, prueba ángulos distintos.

¿Qué imagen vas a crear primero? Comparte abajo lo que generes y cuéntanos qué bloque de la estructura te costó más afinar.

Francisco Espinoza

Estudiante

Prompt: Two children traverse a desolate mountain path leading into a haunting, crumbling cityscape, shrouded in a faint greenish haze from light radioactive rain, captured in photorealistic detail under warm midday light.

Mauricio Herrera

Estudiante

Utilicé este prompt:Create an artistic design of a Roman Empire sunset as viewed from a hill overlooking the city of Rome. The design must have the following characteristics:

- **Time Period**: Set during the time of the Roman Empire, showcasing traditional Roman architecture and style.

- **Viewpoint**: The image should be from one of the hills surrounding the city, providing a panoramic view of Rome.

- **Background Feature**: The Roman Colosseum must be visible in the background.

- **Artistic Style**: The image should be hyper-realistic, capturing the warmth and vibrancy of the sunset while maintaining historical accuracy in terms of architectural details and environmental elements.

# Steps to Accomplish the Task

1. Research images and historical data for architectural accuracy during the Roman Empire period.

2. Study the geographical layout of the hills around ancient Rome for appropriate depiction.

3. Utilize digital tools or painting techniques to achieve hyper-realism in textures, light, and shadows.

4. Ensure the Colosseum is prominent yet harmoniously blended in the background, reflecting accurate historical aesthetics.

5. Emphasize the sunset's color palette to enhance the atmosphere while keeping it reflective of the natural lighting during the era.

# Output Format

- Provide a digital file of a hyper-realistic painting or render, ideally in a high-resolution JPEG or PNG format.

- Ensure the image dimension is suitable for detailed examination and potential large-scale printing if required.

# Examples

- [Example Image 1: A hyper-realistic render exemplifying sunset light techniques]

- [Example Image 2: A historical painting showing the Colosseum with correct architectural detailing]

# Notes

- Pay special attention to historical accuracy in terms of building materials and city layout.

- Consider how climate and vegetation during that period might affect the color and light in the image.

Este prompt lo generé a partir de un borrador que tenía de mi autoría y lo ajuste con un prompt generator para ia*****

Felipe Arango

Team Platzi

Me gusta esta img Francisco muy cinematica!

MANUEL FELIPE VARGAS GARCIA

Francois Mamani Arce

carolina gomez

Frans Jose Godoy Alvarez

Juan Camilo Mejía

Andrés Celi Díaz

Ronald Chén

Hernán Alejandro Acosta Hernández

Juddy Reina Pardo

Brayan Santiago Arismendy Becerra

Ivan Vidal

ANA CAROLINA MENESES HERNANDEZ

Carlos Joaquin Parra Martinez

Héctor Ismael Barros Rodríguez

Jose Luis Moreno Garcia

Nicolas Velandia Hernández

Rodolfo Méndez Niño

Zafiro Ramirez Reque

David Camilo Salas Muñoz

Jaime Sebastián Zhagüi Quizhpe

Yeison Felipe Álvarez Garzon

Antonio Alexander Avila Moreno

Carlos Andrés Garcia Sanchez

Juliana Gallo Fonseca

PAULA VANESSA VASQUEZ DELGADO

Juan Daniel Salgado Reyes

Anatomía de un prompt para imágenes con IA

Creación de Imágenes y la Inteligencia artificial

Creación de Imágenes con Inteligencia Artificial para Marketing

IA creativa: de ideas a imágenes reales

Ética y Responsabilidad en la Creación de Imágenes con IA

Formatos y Aspectos de Imágenes en IA

Práctica con Modelos de IA

Creación de Imágenes con Modelos de IA: Métodos y Errores Comunes