Generar imágenes con Stable Diffusion en Colab
Clase 5 de 15 • Taller de Creación de Contenido con Inteligencia Artificial
Contenido del curso
Crea contenido con IA
- 4

Prompts para contenido de redes con ChatGPT
06:56 min - 5

Generar imágenes con Stable Diffusion en Colab
Viendo ahora - 6
Qué es Control Net de Stable Difussion y cómo utilizarlo.
01:53 min - 7
Zoom Out: La nueva herramienta de Midjourney
02:27 min - 8

Inpainting en Midjourney: Vary (Region)
06:45 min - 9

Crear un video con IA paso a paso
05:52 min - 10

Ética en IA: propiedad intelectual explicada
00:51 min - 11

Ética en IA para contenido responsable
04:45 min
Crea videos animados con Inteligencia Artificial
La creación visual con IA está a tu alcance: con Stable Diffusion 2.1, Google Colab y la interfaz Automatic 1111 puedes generar imágenes hiperrealistas en segundos. Aprenderás a redactar prompts efectivos, usar negative prompts, ajustar sampling steps y controlar la aleatoriedad con seed para obtener resultados consistentes y listos para campañas creativas.
¿Cómo generar imágenes con Stable Diffusion en Google Colab?
Antes de empezar, el enfoque usa un modelo base de Stable Diffusion 2.1 (512×512) del equipo de Stability AI. También puedes cargar un modelo personalizado con tu rostro si ya lo entrenaste y tienes el archivo .ckpt en Google Drive.
¿Qué preparar antes de ejecutar el modelo?
- Abrir el notebook en Google Colab y ejecutar celda por celda.
- Validar que el entorno esté en GPU.
- Instalar la librería para conectar con Google Drive.
- Otorgar permisos y esperar el montaje de Drive.
- Verificar la ruta montada en la sección de archivos.
¿Cómo instalar y lanzar Automatic 1111?
- Instalar Automatic 1111: interfaz visual de Stable Diffusion.
- Ejecutar la instalación de requerimientos extra y esperar el indicador en verde.
- Seleccionar Stable Diffusion 2.1 (512×512) o pegar la ruta del archivo .ckpt si usas tu modelo.
- Lanzar el servidor y abrir la URL de la interfaz web sin user ni password.
¿Cómo escribir prompts efectivos y evitar errores comunes?
Los modelos text to image son muy literales: un pequeño typo cambia el resultado. Especifica sujeto, encuadre, estilo y calidad; y usa negative prompts para excluir elementos no deseados.
¿Qué incluir en el prompt y en el negative prompt?
- Sujeto: “un retrato de un astronauta” o “a female astronaut”.
- Atributos: “sin casco”, view frontal, middle shot.
- Estilo y calidad: hiperrealista, 4K, high definition.
- Exclusiones en negative prompts: borroso, casco, letras, dedos, “algo feo”.
¿Cómo ajustar parámetros para calidad y control?
- Subir los sampling steps a 30: tarda más, pero puede mejorar la calidad.
- Usar el parámetro de control de precisión/creatividad: más alto = menos creativo y más fiel al prompt; un valor de 10 funciona bien.
- Resolución por defecto: 512×512; cambiar width a 768 cuando busques otra composición.
¿Cómo iterar y centrar el encuadre?
- Indicar “centrado” en el prompt para mejorar el encuadre.
- Repetir la generación y ajustar hasta limpiar el rostro y eliminar letras.
- Usar seed -1 para resultados aleatorios; fijar una seed concreta para replicar una imagen.
¿Cómo guardar, reutilizar y escalar resultados en Automatic 1111?
Cuando obtengas una imagen sólida, guárdala y nómbrala para reutilizarla y documentar tu flujo. Si quieres variaciones, cambia la seed o las dimensiones y vuelve a generar.
¿Qué flujo de iteración recomienda el instructor?
- Generar un primer resultado con prompt claro.
- Corregir typos y refinar negative prompts.
- Ajustar sampling steps y el parámetro de precisión/creatividad.
- Cambiar seed para explorar opciones o fijarla para replicar.
- Guardar versiones útiles, por ejemplo: “astronauta campaña”.
¿Ya creaste tu avatar para la campaña del Space Program? Prueba con científicas, ingenieros, estudiantes de Platzi o incluso seres de otro planeta. Comparte tu resultado y deja retroalimentación a tus compañeros y compañeras.