Generación de imágenes con Stable Diffusion

1

Generación de Imágenes con Stable Diffusion: Uso y Aplicaciones

2

¿Cómo funciona text-to-Image: difussion?

3

Stable Diffusion con Google Colab y DreamStudio

Quiz: Generación de imágenes con Stable Diffusion

Generación de imágenes desde AUTOMATIC 11111

4

Instalación de AUTOMATIC 1111

5

AUTOMATIC 1111: interfaz web de Stable Diffusion

Quiz: Generación de imágenes desde AUTOMATIC 11111

Mejora de prompts para Stable Diffusion

6

Prompt tuning con Stable Diffusion

7

Prompt tuning con Stable Diffusion: práctica

Quiz: Mejora de prompts para Stable Diffusion

Inpainting y outpainting con Stable Diffusion

8

Stable Diffusion: Inpainting

9

Instalación de PaintHua

10

Stable Diffusion: Outpainting con PaintHua

Quiz: Inpainting y outpainting con Stable Diffusion

Funciones avanzadas de Stable Diffusion

11

Upscale: escalado de imágenes

12

Image-to-Image

13

Depth-to-Image

14

Merge models: combinar modelos de difussion

15

Qué es Control Net de Stable Difussion y cómo utilizarlo.

Quiz: Funciones avanzadas de Stable Diffusion

DreamBooth: fine tuning de modelos de difusión

16

¿Cómo funciona DreamBooth?

17

DreamBooth: fine-tuning

Quiz: DreamBooth: fine tuning de modelos de difusión

Implicaciones éticas y económicas de imágenes con inteligencia artificial

18

Sesgos y bias en modelos de generación de imágenes

19

¿Cómo afecta la generación de imágenes con IA a otras profesiones?

20

Impacto de arte y diseño con IA: entrevista con Daniel Torres Burriel

21

Perspectiva de artistas y diseñadoras: entrevista con Amelia Amórtegui

Quiz: Implicaciones éticas y económicas de imágenes con inteligencia artificial

Conclusión

22

Uso de Stable Diffusion para Generación de Imágenes Open Source

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Prompt tuning con Stable Diffusion: práctica

7/23
Recursos

¿Qué es Automatic 11.11 y cómo utilizarlo para mejorar imágenes?

Automatic 11.11 es una herramienta que permite optimizar el uso de Stable Diffusion, facilitando la creación y modificación de imágenes mediante técnicas avanzadas de generación de imágenes. Al aplicar un prompt, esta plataforma nos ofrece la posibilidad de personalizar y experimentar con diferentes configuraciones, como ajustar el contraste, las sombras y eliminar residuos visuales indeseados.

Usar esta herramienta es sencillo y versátil. Puedes encontrar prompts en distintas galerías en línea y replicar imágenes mediante ajustes como la semilla, el Guinness Scale, el Sampler, y el modelo utilizado. Cambiar estos parámetros te permite iterar múltiples versiones de una imagen hasta obtener resultados cercanos a la perfección deseada.

¿Cómo manejamos los prompts negativos y ajustamos detalles de nuestras imágenes?

Existen ocasiones en que eliminar ciertos elementos de una imagen es esencial para obtener un resultado más limpio y nítido. Aquí es donde entran en juego los prompts negativos, que nos permiten especificar qué aspectos de la imagen deseamos eliminar.

Para aplicar estos ajustes:

  • Define un prompt base, por ejemplo, una imagen con elementos densos como arbustos y alto contraste.
  • Introduce elementos no deseados en prompts negativos, como granularidad o neblina, para purgar la imagen de dichos artefactos.
  • Modifica los colores para explorar diferentes paletas y estéticas visuales.

Reiterar este proceso te permitirá perfeccionar la calidad de tus imágenes de manera continua.

¿Cómo crear una matriz de prompts y explorar combinaciones?

La función Prompt Matrix en Automatic 11.11 facilita la experimentación con diversas variantes de un prompt básico. Este sistema genera automáticamente variaciones combinatorias de los elementos del prompt, permitiéndote tener múltiples resultados a partir de un mismo punto de partida.

Imagina que deseas crear una imagen de una "chica bonita, cuerpo entero, estilo anime, ojos azules". Utilizando pipes para delimitar elementos, es posible construir una matriz cartesiana que combine estas características de diferentes maneras:

  • Varía el alcance del cuerpo, el estilo de arte y los colores, obteniendo múltiples salidas visuales.
  • Afiance y refine el estilo y características específicas de las imágenes generadas.

Esta herramienta es un poderoso aliado para experimentar con diferentes composiciones sin la necesidad de modificar manualmente el prompt en cada ocasión.

¿Cómo optimizar el detalle de los prompts mediante XYPlot?

El XYPlot es otra excelente herramienta que permite la exploración de variantes de prompts, así como configuraciones detalladas, como el cambio de artistas o el uso de diferentes valores para el Guinness Scale, ofreciendo un nivel sofisticado de personalización.

Para crear un XYPlot:

  1. Define rangos de interés para el eje X, como artistas (por ejemplo, Greg Brutowski, Alphon Musha, Cloud Monette).
  2. Asigna valores de ajuste para el eje Y, como el Guinness Scale (valores de 3, 7 y 10).

Este método se transforma en una visualización de matriz, donde cada intersección revela diferentes combinaciones de estilos artísticos y ajustes previamente seleccionados. Así, se ofrecen múltiples perspectivas para seleccionar la amalgama visual que mejor encaje con tus preferencias creativas.

¿Qué ventajas ofrece experimentar con samplers y otros parámetros?

La capacidad de variar samplers es crucial para obtener el máximo detalle de tus imágenes. Distintos samplers en la plataforma como Euler L, DPM++, y DDM ofrecen diferentes métodos para eliminar ruido en las imágenes, perfeccionando la nitidez y calidad estética.

Al explorar samplers:

  • En el eje Y, prueba con diversas configuraciones de samplers para identificar el que genere mejores resultados.
  • Ajusta el prompt base para evaluar cómo cambia la imagen final con cada sampler diferente.

Estos ajustes cobran vida al permitir la personalización integral del proceso de creación digital, asegurando que cada artista pueda abordar su trabajo con posibilidades ilimitadas y una mirada renovada hacia lo que es posible en el ámbito de la generación de imágenes.

Aportes 20

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

El proximo curso deberia ser especializado en cada uno de los motores, por ejemplo, en Stable Diffusion, usar text inversion o LORAs ayudan mucho para conseguir un estilo o individuo particular, o aplicarso sobre imagenes ya generadas, como si fuera un filtro.

Lo que aún no entiendo es como Alarcón aprendió todo esto XD además de toda la valiosa info que ya dio antes. Grande profe

Prompt: Two androids fighting each other, futuristic city, sf, fantasy, sharp focus, emitting diodes, smoke, artillery, sparks, racks, system, sharp focus, emitting diodes, smoke, artillery, sparks, racks, system unit, motherboard, by pascal blanche rutkowski repin artstation hyperrealism painting concept art of detailed character design matte painting, 4 k resolution blade runne

Prompt: Tiny underwater complete world in large glass bowl, water, omnilight, Sharp detailed and intricate enviroment.

Hola Chic@s 😃!

- Prompt matrix

- Herramienta x\y plot

Algunos prompt negativos utiles para mejorar la calidad de los resultados:

worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry, artist name, b&w, weird colors,

Sachin Teng, (beautiful girl), (((full body))), detailed face, freckles on the face, crystals, light pink blue and white hair, hyperrealistic eyes, heterochromia, symmetrical and proportionate full body, pastel tones, falling snowflakes, lighting, smooth, hyper detailed painting, high resolution, 8k, Unreal Engine, Cinematic
Negative prompt: deformed, ugly, mutilated, disfigured, text, extra limbs, face cut, head cut, extra fingers, extra arms, poorly drawn face, mutation, bad proportions, cropped head, malformed limbs, mutated hands, fused fingers, long neck, bad anatomy, blurry, out of focus, bad framing, big nose
Steps: 75, Sampler: DPM++ 2M, CFG scale: 7, Seed: 56, Size: 512x512, Model hash: 6ce0161689, Model: v1-5-pruned-emaonly

En el prompt solo tuve que escribir : Robot ![](https://static.platzi.com/media/user_upload/image%20%284%29-5f25e27b-85a4-412d-b940-e8cecaf887f0.jpg)

FUN FACT:
Dentro de Playground ai puedes generar imágenes de Stable Diffusion

115 minutos para hacer el segundo ejercicio… fue como 12 minutos por imagen… y eso que tengo 12 gb de ram… pero no tanta GPU

a medieval anime knight |yu gi oh style| capitan tsubasa style | samurai X style

(((realistic))) photo, texture 8k, medium shot body, portrait of a young woman, symmetrical face, natural pure blue eyes, almond-shape eyes, glass ((skin)) face, real ((eyes)) texture.

Jugando con el GFG Scale y los Steps:

lora:COOLKIDS_MERGE_V2.5:1

Prompt: Portrait of a beautiful young asian, slanted, dark eyes with large eyelashes, voluminous wavy black hair, red lipstick, thin strap blouse, perfect face, shine, realistic, best image quality, oil paint, Light clothes, vivid colors, Thin strap blouse, Arte By Jon Bauer, By Mark Brooks, By van Gogh

Es un buen curso, aunque sí concuerdo con la idea de hacer cursos por cada herramienta, por ejemplo:
Un curso de 17 clases exclusivas a Dalle-2
Un curso de 17 clases exclusivas a Midjurney
Un curso de 17 clases exclusivas a Stable Diffusion.

Creo que sería más práctico para sacarle el máximo provecho a esas tres herramientas, que dar una pasada superficial a 10 que estén presentes en el mercado.

Información resumida de esta clase
#EstudiantesDePlatzi

  • Es buena idea ir mejorando el Prompt por medio del A/B Testing

  • Interesante usar las diferentes opciones de script para tener resultados organizados en una matriz y hacer mucho más rápido la optimización del Prompt

Me suele salir un error recurrente cuando trate de hacer los ejemplos del profe Carlos lamentablemente y es este el error:

NansException: A tensor with all NaNs was produced in Unet. This could be either because there’s not enough precision to represent the picture, or because your video card does not support half type. Try setting the “Upcast cross attention layer to float32” option in Settings > Stable Diffusion or using the --no-half commandline argument to fix this. Use --disable-nan-check commandline argument to disable this check.

Trate de solucionarlo por YouTube ahora veo reiniciando Stable Diffusion

Por allí, algo medio, medio que me salió…

Mucho por mejorar aún…