Fundamentos de generación de imágenes con texto

1

¿Qué es text-to-Image en inteligencia artificial?

2

Atención: Estamos actualizando este curso

3

¿Cómo funciona text-to-Image: difussion?

4

Exponentes de IA generativa: DALL·E, Midjourney y Stable Difussion

DALL·E 2

5

Generación de imágenes con DALL·E

6

Atención: Estamos actualizando este curso

7

Restricciones y limitantes de DALL·E

8

Prompt tuning: luces, detalles, sombras y perspectivas

9

Prompt tuning en DALL·E: práctica

10

Prompt tuning: estilos y artistas

11

Prompt tuning en DALL·E: práctica de estilos y artistas

12

Uso de API de DALL·E con Python

Midjourney

13

Atención: Estamos actualizando este curso

14

Generación de imágenes con Midjourney

15

Prompt tuning con Midjourney

16

Prompt tuning con Midjourney: práctica

17

Image-to-Image y Blend con Midjourney

Stable Diffusion

18

Stable Diffusion con Google Colab y DreamStudio

19

Atención: Estamos actualizando este curso

20

Instalación de AUTOMATIC 1111

21

AUTOMATIC 1111: interfaz web de Stable Diffusion

22

Prompt tuning con Stable Diffusion

23

Prompt tuning con Stable Diffusion: práctica

24

Qué es Control Net de Stable Difussion y cómo utilizarlo.

Inpainting y outpainting

25

Atención: Estamos actualizando este curso

26

DALL·E: Inpainting

27

Stable Diffusion: Inpainting

28

Inpainting en Midjourney: Vary (Region)

29

DALL·E : Outpainting

30

Zoom Out: La nueva herramienta de Midjourney

31

Instalación de PaintHua

32

Stable Diffusion: Outpainting con PaintHua

Stable Diffusion features

33

Atención: Estamos actualizando este curso

34

Upscale: escalado de imágenes

35

Image-to-Image

36

Depth-to-Image

37

¿Cómo funciona DreamBooth?

38

DreamBooth: fine-tuning

39

Merge models: combinar modelos de difussion

Implicaciones éticas y económicas de imágenes con inteligencia artificial

40

Atención: Estamos actualizando este curso

41

Sesgos y bias en modelos de generación de imágenes

42

¿Cómo afecta la generación de imágenes con IA a otras profesiones?

43

Impacto de arte y diseño con IA: entrevista con Daniel Torres Burriel

44

Perspectiva de artistas y diseñadoras: entrevista con Juan Dávila

45

Perspectiva de artistas y diseñadoras: entrevista con Amelia Amórtegui

Conclusión

46

¿Qué nos deparará el futuro de la IA generativa?

47

Comparte tu proyecto y certifícate

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

¡Se acaba el precio especial! Aprende Inglés, AI, programación y más.

Antes: $249

Currency
$209
Suscríbete

Termina en:

1 Días
10 Hrs
54 Min
26 Seg

¿Qué es text-to-Image en inteligencia artificial?

1/48
Recursos

Aportes 62

Preguntas 13

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Midjourney /Imagine prompt: Ironman as a Pokémon

Prompt: Heraldic galaxy dragon illuminated by golden night, rendered in ultra defined digital art by cyborg engineer merging AI with human creativity.

Apuntes

Text2Text

💡 Modelos de IA que se entrenan para generar texto en respuesta a otro texto

Consiste en recibir un texto de entrada, se hace un procesamiento del mismo, posteriormente recibimos un texto de salida.

Ejemplo:

  • GPT3 : Un chat muy avanzado

Text-to-image

💡 Técnica para generar una imagen o ilustración utilizando una descripción en texto de dicha imagen (prompt)

En resumen es dejar de entrada un texto, se hace un procesamiento del mismo y se recibe una imagen como respuesta.

Generada con Midjourney!

Si quieren propmts busquen el hilo en tw del divulgador de IA Carlos Santana (@DotCSV)

Este soy yo como Funko pop. solo puse person Funko pop

Excelente que Platzi genere cursos de temas actuales.

![](

Con stable diffusion:



La inteligencia artificial es importante para el desarrollo de la especie humana por varias razones:

Mejora la eficiencia y la productividad: La inteligencia artificial puede automatizar muchas tareas repetitivas y tediosas, lo que libera tiempo y recursos para que los humanos se enfoquen en actividades más importantes y creativas.

Solución de problemas complejos: La inteligencia artificial puede analizar grandes cantidades de datos y encontrar patrones y soluciones a problemas que serían difíciles o imposibles para los humanos resolver.

Mejora la toma de decisiones: La inteligencia artificial puede ayudar a los humanos a tomar decisiones más informadas y precisas, lo que es especialmente importante en áreas como la medicina, la seguridad nacional y la economía.

Mejora la calidad de vida: La inteligencia artificial puede ser utilizada para desarrollar tecnologías y soluciones que mejoran la vida de las personas, como sistemas de asistencia para personas mayores o discapacitadas, tecnología médica avanzada y robots de asistencia doméstica.

En resumen, la inteligencia artificial es importante para el desarrollo de la especie humana porque puede ayudar a resolver problemas complejos, mejorar la eficiencia y la productividad, y mejorar la calidad de vida de las personas.

Los modelos de text-to-image utilizan redes neuronales profundas, como las Redes Generativas Adversarias (GAN, por sus siglas en inglés), que son capaces de generar nuevas imágenes a partir de una descripción textual dada.


  • Estas redes utilizan una arquitectura compleja de dos partes: el generador y el discriminador. El generador genera imágenes a partir de una descripción de texto y el discriminador evalúa la calidad de la imagen generada y la compara con imágenes reales.

De esta manera, el generador ajusta su salida para crear imágenes cada vez más realistas.


Yo generado con IA haha

Las GANs (Generative Adversarial Networks o Redes Generativas Adversarias en español) son un tipo de red neuronal profunda utilizada para generar nuevos datos, como imágenes, música o texto, a partir de un conjunto de datos de entrenamiento existente. Las GANs constan de dos redes neuronales: un generador y un discriminador. El generador se encarga de crear datos sintéticos a partir de un ruido aleatorio, mientras que el discriminador se entrena para distinguir entre los datos reales y los generados por el generador. Con el tiempo, el generador aprende a crear datos cada vez más realistas a medida que el discriminador se vuelve más sofisticado.

Muy emocionado con este curso. Espero poder conseguir cosas más avanzadas que las que pude aprender en el tutorial de DotCSV sobre StabbleDiffusion

![](

Realizado en Leonardo Ai Prompt: 3d render, hyper detailed black dragon with golden details, Fantasy, fantastic theme hyper detailed surreal background, magenta, Fiery Purple Blue, Fiery Cyan, Octane High Quality

Información resumida de esta clase
#EstudiantesDePlatzi

  • Tenemos a un gran profesor

  • Hugging Face es la comunidad más grande de IA

  • Stable Difusion se gestiona desde Hugging Face

  • El componente ético en la IA es muy importante

  • Text to Text = Texto de entrada | Texto de salida

  • Text to image = Texto de entrada | Imagen de salida

  • El potencial de esta herramienta es impresionante

Este soy yo, y mi portafolio ya que estamos: https://daviddevgt.web.gt

La mejor manera de crear logos

yellow plains with red sunrise in the middle and with mist. Stable Diffusion

Este si es un curso increible.

![](https://ideogram.ai/api/images/direct/RxgIPWi6Rn6fUpgguFW5Eg.jpg)
![](https://static.platzi.com/media/user_upload/DALL%C2%B7E%202023-11-27%2020.53.33%20-%20A%20realistic%20panoramic%20image%20%281792x1024%29%20showcasing%20both%20a%20Peacock%20Bass%20%28Cichla%20temensis%29%20and%20a%20Largemouth%20Bass%20%28Micropterus%20salmoides%29%20in%20a%20natural%20la-2e6a40d8-6f5e-4bde-accb-13acb11d9ce0.jpg)
![](https://static.platzi.com/media/user_upload/_d1eec3ed-a316-47cc-ad50-8f56c30c883c-eb114e08-9ce9-409e-9808-b92e12b486d4.jpg) Me fascino la imagen generada con cierto tipos de lentes, asi que intente generar esta.

Estoy super empapado en midjourney, pero me haré el curso para pulir, tqm Carlos

Otros recursos
CLIP
Código

Dall-E ya no tiene creditos de prueba

Antes del curso, ya compartiré los resultados después queridos compañeros de clase.

Es asombroso.
Text-to-Image, o "Texto a Imagen" en español, se refiere a una tecnología que convierte texto o descripciones escritas en imágenes realistas o representaciones visuales. Esta tecnología es un subcampo de la inteligencia artificial, específicamente del procesamiento de lenguaje natural (NLP) y la visión por computadora. Su objetivo principal es generar imágenes basadas en la información textual proporcionada. El Text-to-Image se ha utilizado en diversas aplicaciones, como: * Generación de imágenes a partir de descripciones: Por ejemplo, puedes proporcionar una descripción textual de un paisaje o una escena, y el sistema generará una imagen que se asemeje a esa descripción. * Creación automática de contenido visual: Esto es útil en la creación de contenido para publicidad, presentaciones, diseño gráfico y más. Puedes generar imágenes basadas en un texto que describa un producto o idea. * Asistencia a personas con discapacidades visuales: Las tecnologías Text-to-Image pueden ayudar a las personas con discapacidades visuales al proporcionar descripciones visuales de elementos basadas en texto, como descripciones de imágenes en la web. * Generación de contenido de videojuegos: En el desarrollo de videojuegos, el Text-to-Image se utiliza para crear mundos y elementos visuales a partir de descripciones escritas en el diseño del juego. Estas aplicaciones se han vuelto más avanzadas y realistas gracias al aprendizaje profundo y al uso de redes neuronales generativas, como las GAN (Redes Generativas Adversarias). Las GAN pueden aprender a generar imágenes detalladas y convincentes a partir de texto mediante el entrenamiento con grandes conjuntos de datos de texto e imágenes, lo que permite la generación de contenido visual más preciso y realista a partir de descripciones escritas.

Adjunto link que encontré en la web, sobre 10 modelos de IAs relacionadas a: "Text to image"
Link: https://marketing4ecommerce.net/top-ia-generadoras-de-imagenes/

excelente, me encantan estas tecnologías. https://www.midjourneyai.ai/es mi prompt: astronauta en una tierra nueva con playa como machupichu en peru. !

Venga a darle con todo

A darle con todo

Lo que puedes generar depende de la tecnología como de tu prompt y de tu creatividad.

"Text to Image" es una técnica utilizada para generar imágenes o ilustraciones a partir de una descripción de texto que se proporciona como entrada. Esta técnica aprovecha modelos de inteligencia artificial y aprendizaje automático para transformar una descripción textual en una imagen que corresponda a esa descripción. Esencialmente, el proceso implica convertir el lenguaje natural en contenido visual.

¿Qué significa "Text to Text"? Es un tipo de modelo de inteligencia artificial que se entrena para producir texto en respuesta a otro texto. Brillante en su simplicidad.

text to image: tecnica para generar una imagen o ilustración utilizando una descripción en texto de dicha imagen (prompt)

¿Qué puedo lograr? Crear personajes, animales, con distintos estilos, paisajes, mascotas, galaxias, versiones de distintos estilos.

https://s.mj.run/DQf_ihYjHFM A cute and adorable 3D kitty design made with spline AI. The design should capture the essence of a playful and curious feline, with a focus on creating a lifelike and engaging experience for the viewer. The kitten should be rendered with a high level of detail, using the latest spline AI technology to create a realistic and natural look. The overall effect should be a stunning and impressive 3D design that captures the essence of what it means to be a cute and lovable kitten, with a touch of modern technology. --c 10 --ar 2:3 --v 5

A photorealistic image of three adorable kittens sleeping on their cat bed, taken with a 50mm lens. The image should capture the essence of their peacefulness and cuteness, with a focus on creating a lifelike and immersive experience for the viewer. The kittens should be rendered with a high level of detail, using the latest technology to create a realistic and natural look. The overall effect should be a stunning and impressive image that captures the essence of what it means to be a group of sleepy and lovable kittens, while also conveying a sense of calm and relaxation. --c 10 --ar 2:3 --v 5

A photorealistic image of two adorable kittens playing in a garden, taken with a 50mm lens. The photo should capture the essence of their playfulness and charm, with a focus on creating a lifelike and immersive experience for the viewer. The kittens should be rendered with a high level of detail, using the latest technology to create a realistic and natural look. The overall effect should be a stunning and impressive image that captures the essence of what it means to be two adorable kittens at play in a garden, while also conveying the beauty and tranquility of the natural setting. The photo will be taken from a low angle, to emphasize the kittens’ cuteness and charm, and to give the viewer a sense of being in the garden alongside them. --c 10 --ar 2:3 --v 5

En midjourney ya con cualquier prompt salen imágenes increíbles.

Comparto a este artista que habla sobre Ai, a mi me encanto la forma en la que lo explica.
https://www.youtube.com/watch?v=8Zq_q57_Eho&t=61s

Hola a todos, quería compartirles mi cuenta de Twitter, https://twitter.com/Aprendiendo_IA, donde comparto información diaria sobre las herramientas de inteligencia artificial. Si estás interesado en aprovechar la IA para aumentar tu productividad, no dudes en seguirme.

Mejorando con todo el contenido de platzi sobre IA en mi IG ❤️

https://www.instagram.com/cosmoversoart/

que emocion!! este curso

Muy buen inicio pero coincido con los que ya pusieron que hay que colocar el prompt que utilizamos en cada imagen, eso nos daría mayor contexto para pedir nuestras propias imágenes. Gracias.

Muy buen inicio pero coincido con los que ya pusieron que hay que colocar el prompt que utilizamos en cada imagen, eso nos daria mayor contexto para pedir nuestras propias imagenes. Gracias.

Que energía con Carlos Alarcon… a aprender!

Antes de tomar el curso, me puse a investigar sobre como hacer tu metaverso cuando estuvo en trend.

Ahora que está el trend de las dinoprofesiones, he decido empezar hoy con este curso.

Mi yo alterno generada por Stable Difussion

Yo solo quiero hacer mi dino-profesión

Hola Chicos 😄!

Este tema en lo personal me encanta! 😛

  • Text2text: Modelos de IA que se entrenan para generar texto en respuesta a otro texto.

  • Text-to-image: Tecnica para generar una imagen o ilustraciòn utilizando una descripciòn en texto de dicha imagen (prompt).

Gracias por este curso, motivado a aprender con este tema de generación de imágenes.

Emocionadisimo de estar en este curso 😊

Qué bien, por ahí he estado practicando, pero espero aprender muchos trucos y conceptos importantes.