Y listo, ya sabemos como funcionan los modelos de generacion de imagenes
Fundamentos de generación de imágenes con texto
¿Qué es text-to-Image en inteligencia artificial?
Cómo funciona text-to-Image: difussion
Exponentes de IA generativa: DALL·E 2, Midjourney y Stable Difussion
DALL·E 2
Generación de imágenes con DALL·E 2
Restricciones y limitantes de DALL·E 2
Prompt tuning: luces, detalles, sombras y perspectivas
Prompt tuning en DALL·E 2: práctica
Prompt tuning: estilos y artistas
Prompt tuning en DALL·E 2: práctica de estilos y artistas
Uso de API de DALL·E 2 con Python
Midjourney
Generación de imágenes con Midjourney
Prompt tuning con Midjourney
Prompt tuning con Midjourney: práctica
Image-to-Image y Blend con Midjourney
Stable Diffusion
Stable Diffusion con Google Colab y DreamStudio
Instalación de AUTOMATIC 1111
AUTOMATIC 1111: interfaz web de Stable Diffusion
Prompt tuning con Stable Diffusion
Prompt tuning con Stable Diffusion: práctica
Inpainting y outpainting
DALL·E 2: Inpainting
Stable Diffusion: Inpainting
DALL·E 2: Outpainting
Instalación de PaintHua
Stable Diffusion: Outpainting con PaintHua
Stable Diffusion features
Upscale: escalado de imágenes
Image-to-Image
Depth-to-Image
¿Cómo funciona DreamBooth?
DreamBooth: fine-tuning
Merge models: combinar modelos de difussion
Implicaciones éticas y económicas de imágenes con inteligencia artificial
Sesgos y bias en modelos de generación de imágenes
¿Cómo afecta la generación de imágenes con IA a otras profesiones?
Impacto de arte y diseño con IA: entrevista con Daniel Torres Buriel
Perspectiva de artistas y diseñadoras: entrevista con Juan Dávila
Perspectiva de artistas y diseñadoras: entrevista con Amelia Amórtegui
Conclusión
¿Qué nos deparará el futuro de la IA generativa?
Aportes 30
Preguntas 7
Y listo, ya sabemos como funcionan los modelos de generacion de imagenes
Hola Chicos 😄!
Stable Diffusion:
1. Text encoder(Entendimiento de texto)
2. Image generator
Image formation creator: Generador de la información de la imágen
Image autoencoder: Quien toma el espacio vectorial y genera una imagen como resultado
Diffuser: Generar ruido en una imagen
Mi creaciòn por medio de texto
DALL·E 2: A rancher frog playing the banjo in a swamp, straw hat, cool color scheme, misty, digital art
DALLE es libre y cualquier puede generar una imagen con solo ingresar un PROMPT = descripcion.
Nos enfocaremos en Stable diffusion, que es otra IA de text-to-image, pero con algo muy particular e interesante, ya que funciona en una espacio vectorial en su modelo de DIFFUSION → es una tecnica que agrega ruido a una imagen de alta definicion.
Estos modelos basados en DIFFUSION, funcionan con 2 perspectivas o enfoques:
PROMPT
→ Text encoder (Entendimiento del texto)
CLIP
→ arquitectura desarrollada por openai, capaz de relacionar textos con imagenes, se entrena con data sets de imagenes + su descripción detallada.image generator
: lo que genera la magen → toma un vector generado por CLIP
Diffuser
: es una tecnica que agrega ruido en una imagen, el secreto es pasar una imagen con mucho ruido a una imagen de alta calidad, basicamente predice la imagen, eliminando el ruido**U-net**
: arquitectura que reduce la dimensionalidad, para q sea mas facil de trabajar y luego tambien puede aumentarlo.Miren los logos que realicé:
Anoche estuve buscando un curso de Stable Diffusion sin éxito, y entro a platzi y me encuentro con esto recién publicado ❤️
Me Rindo
¿A qué nos referimos con Prompt?
Es una indicación o instrucción que se le da a un programa para que pueda realizar una tarea específica; en este caso, para la generación de la imagen.
Prompt: cute mini panda working behind a laptop
Midjourney
Las manos son problemáticas para las IA, no he visto alguna que lo haya resuelto 100%.
Si alguien no conocía el término Cadena de Markov (me incluyo) aquí una pequeña definición: Una cadena de Markov se define como una secuencia de variables aleatorias que representan los estados de un determinado sistema durante una serie de intervalos de tiempo, de modo tal que el estado del sistema en el intervalo actual depende únicamente de su estado en el intervalo inmediato anterior y no de los estados previos. Fuente
Luego de varios intentos, esta imagen que logré crear.
Que increible la cantidad de informacion que tomaron para entrenar a esta inteligencia.
Si estás en Venezuela, debes usar VPN
⚛️ Si quieren ver una explicación más detallada de CLIP a su vez que leen el paper, les recomiendo este video, y de paso que le den una mirada a los otros videos de ese canal, creo que son muy entendibles para los papers de ML
La cantidad de procesos internos que se desarrollan dentro de estos elementos es altamente complejo y es bueno saber. Gracias
Este fue mi promt es una técnica de generación de imágenes que utiliza un modelo de difusión para generar imágenes a partir de texto. El modelo de difusión es un modelo generativo que se basa en la idea de que las imágenes se pueden construir a partir de una serie de pasos de difusión que aplican pequeñas perturbaciones a una imagen inicial. En T2ID, estas perturbaciones se generan a partir de un texto de entrada.
Lo primero que generé con Dalle-E: el Homero Simpson bailando reggaeton
Gracias, esperaba este curso, toca afinar la técnica.
Team Platzi, cada vez me sorprendes más,.
Gracias.
:3 Ya me emocione.
Muchas expectativas por este curso, amo aquí!
Image with noise in stable difussion!! 💚
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?
o inicia sesión.