No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Herramientas para la creación de imágenes con IA

5/20
Recursos

¿Cuáles son los modelos más populares para crear imágenes?

¡Hablemos de la emocionante intersección entre arte e inteligencia artificial! En el campo de la creación de imágenes con IA, algunos modelos se han posicionado como líderes, cada uno con sus propias características y ventajas. Entre los más populares en la actualidad se encuentran:

  • MidJourney: desarrollado internamente por la empresa MidJourney, este modelo destaca por la calidad de sus ilustraciones y su comunidad activa.
  • Flux AI: un modelo open source que permite a sus usuarios personalizar y ejecutar localmente el software.
  • DALL-E: creado por OpenAI, DALL-E se especializa en generar imágenes a partir de texto con un enfoque creativo y realista.
  • Stable Diffusion: también es open source y es conocido por su flexibilidad y capacidad para ejecutar en la web.
  • Photoshop: Además de su popular suite de edición de imágenes, Adobe ha incorporado IA a través de Firefly, permitiendo una integración fluida de capacidades de generación de imágenes.

Es crucial comprender que estas tecnologías están en constante evolución. Aunque una empresa o modelo pueda no estar disponible mañana, los principios fundamentales de la interacción con estos modelos de IA permanecerán vigentes.

¿Cómo comunicarse efectivamente con estos modelos?

Para obtener resultados óptimos al generar imágenes, comprender cómo comunicarse con los modelos de inteligencia artificial es esencial. Aquí te presento algunas técnicas comunes y prácticas recomendadas para interactuar con ellos:

  • Texto a imagen (text to image): este método convierte descripciones textuales en imágenes. Es la técnica donde escribes un prompt, y el modelo genera una imagen basada en tu descripción.

  • Imagen a imagen (image to image): ideal para transformar una imagen en una variación, aunque el control sobre el resultado puede ser limitado. Proporcionas una imagen inicial y el modelo genera otra similar que refleja cambios sutiles.

  • Texto más imagen a imagen: integra elementos de texto para guiar la transformación de la imagen. Puedes introducir un texto descriptivo para darle contexto a una imagen inicial que deseas modificar.

  • Imagen a texto (image to text): útil para comprender cómo un modelo interpreta una imagen. El modelo describe lo que "ve" en una imagen, lo que es muy valioso para saber cómo estructurar futuros prompts.

  • Inpainting: permite modificar partes específicas de una imagen manteniendo el resto intacto. Este método se utiliza para añadir o cambiar elementos en sectores concretos de la imagen.

En términos lingüísticos, es recomendable utilizar el inglés para interactuar con estos modelos, ya que suelen procesar más eficazmente este idioma. Herramientas como ChatGPT pueden ser útiles para traducir y optimizar tus instrucciones.

¿Cómo probar Flux AI para crear imágenes?

¿Listo para poner manos a la obra? Flux AI es un modelo open source que te proporciona una vía gratuita para experimentar con la creación de imágenes. Aquí te indico cómo comenzar tu aventura:

  1. Registro: comienza visitando Flux-AI.io y regístrate para obtener un free trial. Utiliza tu cuenta de Google para un acceso más rápido.

  2. Uso de créditos: Al registrarte, obtendrás 40 créditos que podrás utilizar para generar imágenes.

  3. Creación de imágenes: navega a las herramientas de Flux AI y selecciona la opción para crear imágenes. Introduce un prompt detallado, como en el ejemplo del "escarabajo verde oscuro" o del "páramo colombiano", especificando los aspectos visuales que deseas.

Prompt: "escarabajo verde oscuro, un carro, un pichirilo, un vocho, manejando a través de un valle con las montañas andinas colombianas en mitad del día"
Aspect Ratio: "16:9"
  1. Analizar resultados: observa la imagen generada y busca detalles que podrían requerir ajustes. Elementos específicos como las placas del carro pueden no coincidir con tus expectativas debido a la base de datos limitada de imágenes locales.

  2. Comparación y corrección: afina tus instrucciones, ajustando los detalles hasta obtener el resultado esperado. Este proceso de prueba y error es esencial para entender mejor el funcionamiento de los modelos.

Enfrentarse a desafíos como la precisión cultural o locativa es parte del aprendizaje. Intenta identificar posibles errores y compartir tus hallazgos con la comunidad, enriqueciendo así tu experiencia y la de otros. ¡No dudes en explorar y seguir perfeccionando tus habilidades!

Aportes 28

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Aquí generé un Mazda 3, viajando cerca del volcán Chimborazo en Ecuador, el error en la imagen es que; El auto no tiene las placas del Ec, las calles hacia el Chimborazo no son tan perfectas jajaj y faltan un más montañas. ![](https://static.platzi.com/media/user_upload/d95d8f95-e0f0-4957-aaea-852f14cc5187_123336458.jpeg-54cd9ed6-b114-44e9-9cf4-64d65bbe6aa9.jpg)
este curso esta espectacular, estoy haciendo un proyecto y esto cambia todo pata mi, cada vez que llego a la parte de imagenes para alguna landing o algo en especifico era un problema, o crear las imagenes con chatgpt es muy complicado, con estas herramientas y un muy buen prompt obtuve todo lo que necsitaba para el proyecto en el que estoy trabajando, excelente platzi y muy buen profesor.
![](https://static.platzi.com/media/user_upload/Flux1.AI-2025-01-08-c5293daf-e9d0-4e05-9756-6df8edb3f2f0.jpg)Que ingrediente le faltan a la bandeja paisa ?.
### **Modelos populares de generación de imágenes** 1. **Stable Diffusion** * Modelo de código abierto que puede ejecutarse en la web o localmente. 2. **Flux-ai** * Otro modelo de código abierto ideal para usuarios con conocimientos técnicos. 3. **Midjourney** * Modelo cerrado desarrollado por la empresa Midjourney. 4. **DALL-E** * Creado por OpenAI, también es un modelo cerrado. 5. **Photoshop Firefly** * Motor de IA integrado en Adobe Photoshop, controlado por Adobe. **Diferencia clave:** * **Modelos cerrados:** Propiedad de empresas específicas, con control absoluto. * **Modelos abiertos:** De código abierto, permiten ajustes y ejecución local si se tienen conocimientos técnicos. ### **Métodos para crear imágenes con IA** #### **1. Texto a imagen ("text-to-image")** * Introduces un texto o "prompt" para que el modelo genere una imagen. * Ejemplo: "Un escarabajo verde oscuro atravesando un valle andino colombiano". #### **2. Imagen a imagen ("image-to-image")** * Das una imagen como base, y el modelo genera otra imagen basada en esta. * Este método ofrece menos control en el resultado. #### **3. Combinación de texto e imagen** * Combinas un texto y una imagen como referencia. * Ejemplo: Proporcionas una obra de arte y le pides al modelo que la recree añadiendo ciertos elementos. #### **4. Texto a partir de imagen ("image-to-text")** * Le pides al modelo que describa una imagen. * Útil para aprender cómo estructurar tus *prompts*. #### **5. Modificación específica ("inpainting")** * Permite modificar partes específicas de una imagen ya generada. * Ejemplo: Agregar un avión o casas solo en ciertas áreas de una imagen existente. ### **Cómo obtener mejores resultados** 1. **Describe con precisión**: Usa descripciones detalladas en los *prompts* para obtener imágenes más fieles a tu idea. 2. **Utiliza imágenes de referencia**: * Alimenta al modelo con imágenes similares a lo que deseas generar. 3. **Practica el inglés**: * Muchos modelos funcionan mejor con *prompts* en inglés. Usa herramientas como ChatGPT para traducir tus ideas. 4. **Prueba y error**: * Genera imágenes y analiza los errores para ajustar tus *prompts*. ### **Errores comunes en las imágenes generadas** * **Detalles incorrectos**: Ejemplo: En un escenario colombiano, las placas del carro pueden no coincidir con las de la región. * **Elementos imprecisos**: Ejemplo: Frailejones que no corresponden a la vegetación real de un páramo colombiano. * **Aspectos anatómicos**: Las imágenes pueden presentar errores como dedos adicionales o proporciones extrañas.
Mi prompt: A low-angle perspective near the ground, capturing a colossal, mythical wolf standing on rocky terrain under a stormy night sky. The wolf has glowing eyes and intricate fur patterns resembling ancient runes, with a massive, ornate sword clamped in its powerful jaws. Lightning bolts illuminate its towering figure, emphasizing its imposing size and divine aura. Dark, epic, and cinematic atmosphere, ultra-realistic details, 4K resolution. La falla es que una pata del lobo no se nota y tampoco sostiene la espada con su mandíbula ![](https://static.platzi.com/media/user_upload/5668ff40-4983-4f75-b6af-f3bb78882cbf_6379466.jpeg-5f215969-8ba5-49ce-b70b-28ac808c9989.jpg)
Esto fue lo que me ilustró cuando le escribí "Chigüiro" (así lo llamamos en Colombia) ![](https://static.platzi.com/media/user_upload/chiquiro-7c9e259f-a72b-4b87-8b3e-1f3731a53be7.jpg) Pero cuando usé la palabra "Capibara" si ilustró el animal que esperaba. ![](https://static.platzi.com/media/user_upload/capibara-39b418b3-f865-4990-be11-6d1db5ee2535.jpg)
Bien, lo que hice fue subir una imagen a chatGPT y pedirle que la describiera. Use parte de su descripción como prompt. Este es el Prompt: two men standing outdoors next to a stone marker with a blue and yellow scallop shell symbol, which is associated with the Camino de Santiago pilgrimage. The marker indicates “Km 0,000,” signifying the end point of the route. Both men are wearing hiking gear, including backpacks, and appear to be smiling. One of the men ins Mexican in his mid 40's, and the other man is American in his late 60's. The background features a stunning coastal view with cliffs, the ocean, and a partly cloudy sky. La vieira del Camino De Santiago no es así. Siempre apunta hacia un costado. Y al fondo se ve una especie de alberca, quizá un hotel, que tampoco estaba en la foto original, es decir, no fue pedida en el prompt. Pero, me gusto el resultado.![](</Users/al-m1/Downloads/ two men standing outdoors next to a stone marker with a blu_1882799649793323009.png>)
A mystical and beautiful scene of a Subaru Crosstrek car driving across a lush valley in the Colombian Andes mountains. The midday sun casts soft shadows, highlighting the vibrant greenery and rugged peaks. Claramente, la placa no es colombiana, pero todo lo demás es muy preciso ![](https://static.platzi.com/media/user_upload/8ac613f3-33cc-4095-b5dd-16c45bade918_3337721.jpeg-d36a0ba8-5fab-484b-b122-fdb32907dfbc.jpg)
Master mira esta es una de las imagen que recree, estoy enfocado en imágenes que me ayuden a vender producto y que sean muy llamativas, ¿ Te pregunto que recursos me recomiendas ?. Para este prompt Create an image of tennis shoes in a sports space that has sun and is in a park in the middle of the city ![](https://static.platzi.com/media/user_upload/image-a204655b-59f4-4309-a3a1-ad788a6dd0e1.jpg) ![](file:///C:/Users/Student/Downloads/f4cf84ea-770f-4241-b92d-4999353423fb_619462.jpeg.webp)![]()![]() ![]()![]()![](<Create an image of tennis shoes in a sports space that has sun and is in a park in the middle of the city>)
My prompt was just "2 CEOs with anime style" As usual the hands have a weird look: ![](https://static.platzi.com/media/user_upload/image-bb1c123f-24bf-4b90-be4b-69b9e5ea9a25.jpg)
![](https://img.artiversehub.ai/online/2025/1/25/73df5984-d780-4aae-bf75-4151479af672_13152126.jpeg)la única pequeña falla que puedo ver en esta imagen es que cuándo se unen los ríos se da una pequeña mal formación en el agua que no es común de resto todo es perfecto, acá dejo el prompt. An aerial view of a stunning natural landscape featuring a wide, powerful river flowing through the scene. The riverbanks are dotted with small, rustic houses, surrounded by lush green vegetation, including dense trees and open grassy fields. The atmosphere is serene, with the warm, golden hues of a vibrant sunrise illuminating the distant horizon. The scene captures the tranquility and natural beauty of this riverside setting.
![](https://static.platzi.com/media/user_upload/2689174e-e7e1-4afa-bc3a-2566b70daf31_20532792.jpeg-2874fc63-0871-4c96-9115-ec79915bc336.jpg)En la descripción pedí una Playa de boca del rio Veracruz, pero la arena no es blanca y parece tener banqueta en la costa cosa que no lo tiene en la realidad.
Hola a todos, en mi caso queria que la IA generara una ilustracion donde representara el viaje de un inmigrante colombiano que trasciende los desafíos de la vida. dejando atras lo colorido de nuestro pais y abrazando una nueva vida.![](https://img.artiversehub.ai/online/2025/1/17/b8881d59-0ed6-4d45-bb0b-c1c50b6d2aa8_44447259.jpeg)
![](https://static.platzi.com/media/user_upload/d8841647-816d-40c4-be55-cf0a53b1934f_0263430.jpeg-ad2baf07-139b-4909-8fca-47be75f2ad71.jpg)
![]()![](https://static.platzi.com/media/user_upload/Screenshot%202024-12-23%20184234-6efe908c-3817-4cfc-8226-35c2d6b9880f.jpg) La idea de generación buscaba representar un equipo de vulcanólogos en Islandia realizando experimentos de astrobiología cerca de un volcán activo, pero la imagen presenta errores como la combinación poco realista de auroras boreales con lava incandescente, la posición insegura de los científicos demasiado cerca del cráter, equipamiento ambiguo y faltante, además de un terreno volcánico simplificado que no refleja la inestabilidad y peligro real del entorno.
¡A por ello!
¿Cuáles son los modelos más usados para Image to Image y Text + Image to Image
Mi Propmpt: Utiliza la ubicación del lago de Sololá de Guatemala, haz una barca pesquera con su pescador, en un atardecer en tiempo de diciembre que es un tiempo muy frio, con un sol precioso observando panachel iluminada ya en su pueblo. Error: No hizo el pueblo, el atardecer no creo sea la hora del cielo adecuada, y le falto definición del lugar. ![](https://static.platzi.com/media/user_upload/image-d41af7ef-8d54-4411-a02b-60fe32a244c5.jpg)
![](https://static.platzi.com/media/user_upload/image-1f20259b-9d6c-4abd-9ef0-fb2742455d51.jpg)
![](https://static.platzi.com/media/user_upload/image-5d1e0a2d-b11d-4d99-bb8d-8a289de08423.jpg)
![](https://static.platzi.com/media/user_upload/bd5b3eb3-035b-4421-91f6-9d1520aee3d0_73839929.jpeg-78e60dc8-7c1a-4a62-ab91-c2311db19adc.jpg)
![](https://static.platzi.com/media/user_upload/bd5b3eb3-035b-4421-91f6-9d1520aee3d0_73839929.jpeg-b00463fe-d075-4f25-940c-4cf0420039ae.jpg)My dream is comming true
Me gustan las hiostorias de fantasia, asi que Pedi una mujer delgada, de pelo largo negro con las puntas plateadas, montando un dragon negro de escamas iridiscentes y garras afiladas. El error: la escala mujer/dragon no creo que sea la que pedí, y a la mujer le puso por pies, las garras ![](https://static.platzi.com/media/user_upload/image-76196c56-fad2-4572-904c-e1694fa11574.jpg)
![](https://img.artiversehub.ai/online/2025/1/29/0968a6d9-9b9e-417b-9995-4c621546174f_52652594.jpeg) solo falto la placa pero de resto me parecen bien
![](https://static.platzi.com/media/user_upload/image-69b9c732-86ef-4590-9284-53537108ade0.jpg)![](https://static.platzi.com/media/user_upload/image-5a94016f-7256-4cc8-b576-8fe26e698e4d.jpg)
My prompt ¨Steampunk cat, octane render, hyperrealistic¨ ![](https://img.artiversehub.ai/online/2025/1/27/fccc2b0c-5d08-4485-906e-9f5e48d31df0_221636975.jpeg)
![](https://static.platzi.com/media/user_upload/image-f3417019-6d54-4354-97c5-1882310cb180.jpg)
![]()La IA colocó la taza de café encima del libro y no a un costado