Cómo crear y editar imágenes con ChatGPT

Cursos Empresas Blog Live Conf Precios

Contenido del curso

Módulo 1: Fundamentos de ChatGPT

Módulo 2: Uso efectivo de ChatGPT

Módulo 3: Investigación y Creación de Contenidos

Módulo 4: Análisis de Datos

Módulo 5: Automatización y Funciones Avanzadas

Módulo 6: Proyecto Final: Construye tu Asistente GPT

Tomar examen

Cómo crear y editar imágenes con ChatGPT

Resumen

Crear imágenes con ChatGPT te permite acompañar documentos, presentaciones o ideas con visuales generados por inteligencia artificial sin salir de la conversación. Esta guía te muestra cómo activar el modo imagen, refinar prompts y combinar fotografías para obtener resultados específicos.

¿Cómo activo la generación de imágenes en ChatGPT?

Existen dos caminos para que ChatGPT entienda que necesitas una imagen y no solo texto.

El primero es escribirlo directamente en el prompt: basta con pedir crea una imagen o crea una fotografía seguido de la descripción. Por ejemplo, crea una imagen de un payaso en la playa activa automáticamente la función multimodal y genera dos alternativas para que elijas. [00:24]

El segundo camino es usar el botón de signo más dentro del chat y seleccionar crea imagen. Esa acción le indica al modelo que produzca contenido visual sin necesidad de aclararlo en el texto. [01:33]

¿ChatGPT puede generar cualquier imagen? No. El modelo valida cada generación antes de mostrarla y bloquea personajes con copyright o marcas registradas. Por eso primero genera la imagen por detrás y luego la despliega de a poco.

Una vez lista la imagen, puedes descargarla, copiar el enlace o compartirla en redes sociales desde el menú que aparece bajo cada versión.

¿Qué formatos y estilos puedo pedirle a ChatGPT?

El modelo trabaja con tres relaciones de aspecto fijas, así que conviene indicarlo desde el prompt.

Vertical 9:16, ideal para celular y stories.
Cuadrado 1:1, útil para redes sociales y miniaturas.
Horizontal 16:9, pensado para presentaciones y video.

Cualquier proporción intermedia debes ajustarla después en un editor externo, PowerPoint o Word. [02:32]

Además del formato, puedes elegir entre dos grandes mundos: ilustración o fotografía realista. La ilustración suele salir excelente al primer intento, mientras que la fotografía requiere algunas iteraciones para afinar detalles. [03:13]

¿Cómo logro mayor control sobre la imagen generada?

ChatGPT funciona como un traductor entre tu idea y el prompt final que usa para generar la imagen. A diferencia de herramientas especializadas, expande y reinterpreta lo que escribes, así que mientras más descriptivo seas, más fiel será el resultado. [03:41]

Un ejemplo concreto: en lugar de pedir una pareja en el parque, puedes detallar una fotografía de una pareja paseando por el parque al atardecer, con varios niños jugando, un perro entrando desde la derecha y la luz asomándose entre las hojas de los árboles. Cada elemento añadido reduce la interpretación libre del modelo. [04:18]

¿Qué palabras mejoran un prompt de imagen? Términos como toma de acción, estilo de terror, colores cálidos, neón, lente GoPro o foto de iPhone dirigen la estética. Describir lente, paleta y mood acerca el resultado a lo que imaginas.

¿Cómo edito o transformo imágenes existentes?

ChatGPT no solo crea desde cero, también puede tomar una imagen tuya como referencia y reinterpretarla.

Al cargar una foto, por ejemplo de una mascota, puedes pedirle que aplique un estilo específico como Studio Ghibli, retrato dramático, libro para colorear o sesión de foto. La pestaña de Estilos ofrece presets listos para aplicar. El modelo conserva los elementos clave de la escena original y solo cambia la estética. [05:48]

¿Cómo modifico solo una parte de la imagen?

El botón de seleccionar que aparece sobre la imagen generada permite marcar un área específica y pedir cambios solo en esa zona. Si seleccionas el collar de una mascota y escribes cambia el color del collar por uno rojo, ChatGPT regenera únicamente ese fragmento sin alterar el resto. [07:11]

Esto es útil cuando una generación quedó casi perfecta pero un detalle no convence, evitando rehacer toda la composición.

¿Cómo combino dos imágenes en una sola escena?

Puedes adjuntar dos fotografías y pedirle a ChatGPT que las fusione en una composición unificada. Un caso práctico: una imagen de producto, como una bebida ficticia, junto a una escena de una mesa con computador.

El prompt debe ser muy específico, por ejemplo: quiero crear una imagen donde aparezca la bebida adjunta encima de la mesa de la otra fotografía, ubicada a un costado del computador y que parezca una fotografía de producto. El modelo respeta los elementos de ambas imágenes y los integra en una sola escena coherente. [08:30]

Esta función es especialmente útil para generar mockups, fotos de producto y escenas que luego puedes compartir con diseñadores o usar directamente en presentaciones internas.

¿Para qué casos reales conviene usar imágenes generadas?

Las posibilidades van mucho más allá de los ejemplos básicos.

Cambiar el estilo visual de una fotografía personal.
Crear ilustraciones a medida para una presentación corporativa.
Generar fondos de pantalla únicos para computador o celular.
Producir mockups de producto sin contratar a un fotógrafo.
Diseñar escenas conceptuales para validar ideas con tu equipo.

La clave siempre vuelve al mismo punto: prompts descriptivos, iteración y uso inteligente de las funciones de selección y combinación. Anímate a probar y comparte tus creaciones en los comentarios.

Comentarios

Héctor Alonso Padilla Ramírez

Estudiante

Francisco Jesús Eslava Fernández

Estudiante

Boris Turcios

Estudiante

•

Roger Napoleón Ortega Girón

Estudiante

Carlos Andrés Garcia Sanchez

Estudiante

ANA ANGELA GUZMÁN RAMÍREZ

Estudiante

•

Nicole Muñoz

Estudiante

Ada Gloribel Díaz López

Estudiante

Fabián Leonardo Peñaranda Lozano

Estudiante

Javier Ramos

Estudiante

Dario Fernando Burbano Hernandez

Estudiante

Roger Napoleón Ortega Girón

Estudiante

Ángel cano

Estudiante

Jose henry sanchez castillo

Estudiante

Jose henry sanchez castillo

Estudiante

•

Carlos Loayza Ponton

Estudiante

Oliver Ramirez Guerra

Estudiante

Oliver Ramirez Guerra

Estudiante

Catherine Argüello Castro

Estudiante

David Moisés López León

Estudiante

Gabriel Obregón

Estudiante

Lizette Rosalía Dazza Hernández

Estudiante

Juan camilo Muñoz Blanco

Estudiante

Claudia Maricel Bustamante Birnstil

Estudiante

Sergio Antonio Camacho Maldonado

Estudiante

Mateo Montoya Henao

Estudiante

GERARDO VELAZQUEZ MARTINEZ

Estudiante

Si quieren que ChatGPT les desarrolle un prompt a detalle, a partir de otra imagen, acá les comparto el que utilizo yo:

Create a highly detailed and hyper-realistic prompt in English describing this photograph with precise information about lighting, camera angle, materials, textures, environment, mood, and visual context. The prompt must be optimized for AI image generators.

Muy buen prompt, gracias por compartir

ProTIP: no generar la imagen en chat GPT , en su lugar indicarle a chat GPT que genere un Prompt para generar una IMAGEN de forma ultra detallada tomando en cuenta una imagen de referencia 👅

eso me a funcionado muy bien, lo recomiendo

Inspirado en aquel comercial de 1991 de Nescafe

El prompt: una mujer de pelo negro, mirando al infinito con una mirada cautivadora tomando una taza de cafe, ella esta cogiendo la taza con las dos manos con una sensación donde ella se esta calentando. La taza de cafe es roja, sale el vapor del cafe caliente, se puede ver como los rayos del sol iluminan la taza. la escena es la siguiente: es un atardecer, iluminación calida de 30 grados, un 20% de niebla en el ambiente, poca lluvia, se siente un ambiente frio. Donde se encuentra la mujer: ella esta mirando por la ventana, en un dia lluvioso, donde los rayos del sol comienzan a salir, ella esta en una cabaña en las montañas donde se puede ver un lago a una distancia media, los arboles y la vegetacion estan humedos por la lluvia. en la taza de cafe dice Nescafe. la imagen debe ser hiperrealista

Me ha servido mucho en mi negocio de sublimación de tazas

No pude conocer a mi perrita de cachorro ya que las rescaté cuando era un poco mayor, con chat gpt logré recrear esta imagen

A la imagen le incorporé a mi gatito.

Que bonito gatito, felicidades por tu ejercicio con Chatgpt.

Como anécdota cuando salio al mercado la función de generar imágenes con el Estilo de estudio Ghibli, fue tal la demanda que literalmente las tarjetas GPU se estaban derritiendo, los ventiladores trabajaban a mil, como decimos se imaginan el alboroto en esos data centers? como decimos en mi tierra "esos servidores soplaban mas que vicioso"

Me ha servido mucho para hacer publicidad para mis cuentas de Entretenimiento!

yo me apoyo en chatgpt para la creacion de prompt y luego utilizo loveart para la generacion y me ha resultado muy bien, de hecho le comparto a Chatgpt la imagen resultante para que juntos la editemos, funciona!!

Esta es mi creación: Un gato motivado, disciplinado, fuerte, entrenando de noche, en un gym oscuro.

Maneje este prompt Promtp para video de mi gatica la imagen quedo Genial

Ultra-realistic cinematic macro video of a tabby cat in low-key lighting, extreme close-up portrait.

SCENE SETUP:

Sub el video de mi gatica (saori)

Dark background, dramatic Rembrandt lighting, soft warm key light from the left, subtle rim light outlining the cat’s silhouette. Hyper-detailed fur micro-texture, visible pores, natural imperfections, realistic whiskers.

SUBJECT BEHAVIOR:

The cat remains still but alive — subtle breathing, micro head adjustments, tiny whisker tremors. Eyes exhibit realistic tracking behavior and micro-saccades.

BUTTERFLY:

A small bioluminescent butterfly enters frame from the left, glowing in soft cyan-blue tones. Wings flap with natural irregular rhythm (not mechanical), emitting faint floating particles. Light from the butterfly softly illuminates the cat’s nose and reflects in the eye.

CAMERA:

85mm lens simulation, f/1.8 shallow depth of field.

Cinematic slow push-in (very slow dolly forward).

Focus breathing effect as the lens adjusts between the butterfly and the cat’s eye.

Subtle handheld micro-shake (barely noticeable, organic).

TIMELINE:

0–2s: Cat still, breathing subtly, eye reflecting ambient light.

2–4s: Butterfly enters slowly, out of focus (bokeh glow).

4–6s: Focus shifts from cat eye to butterfly (rack focus).

6–8s: Cat’s eye tracks butterfly, micro movement in whiskers.

8–10s: Butterfly approaches nose, glow intensifies slightly.

10–12s: Extreme detail moment — eye reflection shows butterfly clearly.

LIGHTING:

High dynamic range (HDR), deep shadows, controlled highlights.

Rembrandt triangle on cat face.

Rim light separating subject from background.

Butterfly acts as secondary moving light source.

COLOR GRADING:

Cinematic teal-orange, subtle and natural.

Warm tones on fur, cool tones from butterfly.

High contrast but not crushed blacks.

MOTION QUALITY:

Shot at 24fps cinematic base with simulated 120fps slow-motion feel.

Natural physics, realistic inertia, no jitter artifacts.

RENDER:

8K resolution, ultra sharp but filmic.

Natural grain (very subtle), no over-sharpening.

Depth of field physically accurate.

STYLE:

Wildlife documentary meets high-end cinema.

Award-winning cinematography, emotionally immersive.

Esta es mi creación, muy buena la explicación

Tu hígado/Una coca cola fría

Por cierto que tal consideran la siguiente estrategia:

Cuando quiero crear una imagen compleja con varias imágenes de referencia, por ejemplo esta. Que use una escena de Odisea del espacio, y otra de una lata sin marca.

Primero, paso el fondo a la IA y le pido que lo pase al estilo deseado y de ser necesario le pido algunos cambios
Luego paso los demás elementos por separado y hago lo mismo
Al final los uno todos en una misma imagen

En general e visto mejores resultados. Con versiones gratuitas.

Funciona muy bien esa técnica para generar imágenes, que se llama image to image, modelos como Midjourney, lo hace muy bien y muy preciso. Chat GPT cada vez lo hace mejor.

animé esta foto que tome con mi familia y mi perrito fallecido

🎨 Generación de imágenes con ChatGPT

🎯 OBJETIVO

👉 Usar ChatGPT para crear imágenes aplicables a:

📄 Documentos
📊 Presentaciones
🎨 Material visual creativo

✍️ EL PROMPT (CLAVE PRINCIPAL)

🔑 Un prompt claro y específico permite mayor control del resultado.

🧩 Se pueden definir:

🌄 Escena
💡 Iluminación
🎨 Estilo visual
🖌️ Colores

➡️ Más detalle = mejor resultado

🖼️ TIPOS DE IMÁGENES

ChatGPT puede generar:

🖍️ Ilustraciones
📷 Fotografías
🎭 Imágenes con estilos específicos

🔄 Se ofrecen 2 versiones para elegir la mejor.

📐 FORMATOS DISPONIBLES

Selecciona el formato según el uso:

📱 Vertical → 9:16
⬜ Cuadrado → 1:1
🖥️ Horizontal → 16:9

✔️ Útiles para presentaciones, documentos y contenido digital.

🛠️ FUNCIONES AVANZADAS

Permiten mayor personalización:

🖼️ Usar una imagen base
✂️ Editar zonas concretas por selección
🧱 Combinar varios elementos en una escena

➡️ Facilitan un trabajo más creativo y preciso.

֎🇦🇮 Clase #13 Creación y edición de imágenes con ChatGPT

Cómo generar imágenes: escribe “Crea una imagen…” o usa el botón “+” → “Crea imagen”; se generan dos versiones para elegir.
Después de crear: puedes descargar, compartir o copiar el enlace desde el panel.
Restricciones: el sistema valida contenido (ej. marcas o personajes con copyright).
Relación de aspecto disponible: 9:16 (vertical), 1:1 (cuadrado) y 16:9 (horizontal).
Indícalo en el prompt para evitar recortes posteriores; otros formatos requieren edición externa.
Prompt con control fino: describe escena (sujetos, entorno, acción), luz (atardecer, contraluz), estilo (fotografía, ilustración), paleta (cálidos, neón) y “equipo” simulado (GoPro, iPhone).
Itera si es fotografía: ajusta detalles hasta lograr realismo y composición deseada.
Editar imagen existente: sube una foto base y pide variaciones de estilo (ej. tipo Studio Ghibli); mantiene estructura y objetos principales.
Herramienta Seleccionar: marca un área y solicita cambios puntuales (ej. “cambia el collar a rojo”) sin rehacer toda la imagen.
Combinar imágenes (mockups): sube producto + escena y especifica ubicación exacta y estilo (“fotografía de producto”); revisa las dos alternativas y elige la más sólida para tu presentación.

No me gustò mucho como quedo la lata, pero practicamente le pedi a la ia que creara una bebida energizante, y despues en otra ventana le pedi que con esa lata la pusiera en la playa.

Se que pudo haber salido mejor, o ajustarla un poco mas, pero este es el resultado pidiendo solo 2 prompts

🚀 Image Creation & Editing with ChatGPT for Presentations 🖼️

🔑 Key Concepts:

Multimodal as a Creative Co-Pilot: This isn't just "text-to-image." It's iterative, conversational image generation and editing. You describe, the AI generates, you critique, and the AI refines. The critical part for presentations is the ability to generate images that are conceptually aligned with your text, not just random pretty pictures.
The "Visual Prompt" & Inpainting/Outpainting: Beyond simple text descriptions, you'll be using "visual prompting." This means giving the AI an initial image and then describing what you want to change (inpainting) or expand (outpainting). For presentations, this allows you to maintain brand consistency or extend an existing visual theme.
Connecting Domains:
- Marketing: This is your rapid prototyping engine for visual assets. Need 10 different hero images for A/B testing a landing page? Generate them in minutes. Need to visualize a complex data point? Describe it, get an image.
- Startup: This drastically reduces your reliance on expensive stock photo subscriptions or slow graphic designers for early-stage visual assets (pitch decks, initial website mockups, social media).
- AI/Dev: This is the practical application of Diffusion Models and Latent Space Manipulation. You're essentially navigating a high-dimensional space with natural language.

🏭 Industry & Startup Application:

Company: A small e-commerce startup selling custom-designed shoes.
Application: Rapidly generating marketing visuals and product mockups for their website and social media campaigns.
The Process:
1. Concept to Image (Marketing): The founder wants a hero image for a new "Cyberpunk Future" collection. [PROMPT: "Create a photorealistic image of a pair of high-top sneakers, with iridescent panels and glowing neon accents, on a futuristic city street at night. Focus on the shoes." ]
2. Iterative Refinement (Marketing/Design): The founder sees the image: "Looks good, but make the background more blurred to put more focus on the shoes. Also, change the neon accents from blue to electric purple."
3. Variant Generation (Marketing/A/B Testing): "Now, create 3 variations of that image, each with a different color scheme for the glowing accents (e.g., red, green, gold)."
4. Presentation Integration (Startup): These generated images are then dropped directly into the pitch deck, replacing generic stock photos with highly specific, on-brand visuals.
Why it Matters: This significantly reduces Time-to-Market (TTM) for visual content. The startup can test visual concepts, iterate on design, and produce high-quality assets without a dedicated design team, which is a massive cost saving and speed advantage.

🔮 Future Steps & Project Hooks:

Project Hook 1 (Dev/AI): Build a "Visual Storyboard Generator." Use the image generation feature. Give it a text-based story outline (e.g., "A knight enters a dark forest. He encounters a dragon. He battles the dragon. He wins."). Your task is to generate 3-4 distinct images that visualize key scenes, maintaining a consistent artistic style across all images.
Project Hook 2 (Startup/Marketing): "The 'Brand Identity' Image Pack." For your hypothetical startup, develop a core prompt that describes your brand's visual identity (e.g., "minimalist, pastel colors, natural light, clean lines"). Then, use it to generate 5 distinct image types: a product shot, a team collaboration scene, an office interior, a customer interaction, and an abstract brand logo concept. This is a foundational exercise in visual brand consistency.
Next Step: The next level is integrating your brand guidelines and existing assets directly into the image generation process. Explore how you can use tools like ControlNet (with Stable Diffusion, often via API or local setups) to enforce specific poses, styles, or even re-skin existing 3D models with AI-generated textures. This is where truly consistent, production-ready visual assets emerge.

Hi Mateo. Congratulations. Your language english is perfect and your synthesis are very good. Sorry, Where are you from and where are you learned english language?

Módulo 1: Fundamentos de ChatGPT

ChatGPT como copiloto real de trabajo

Cómo ChatGPT genera respuestas únicas

Cómo crear tu cuenta en ChatGPT

Módulo 2: Uso efectivo de ChatGPT

Estrategia de prompts con 5 elementos clave

Prompting encadenado con modelos de razonamiento

Modo de voz en ChatGPT para pensar mejor

Personalización y memoria en ChatGPT

Controles de privacidad en ChatGPT

Módulo 3: Investigación y Creación de Contenidos

Búsqueda web en ChatGPT para info actual

Cómo hacer reportes completos con Deep Research

Analiza documentos y PDFs con ChatGPT

Cómo editar documentos con Canvas en ChatGPT