Resumen

La creación visual con IA está a tu alcance: con Stable Diffusion 2.1, Google Colab y la interfaz Automatic 1111 puedes generar imágenes hiperrealistas en segundos. Aprenderás a redactar prompts efectivos, usar negative prompts, ajustar sampling steps y controlar la aleatoriedad con seed para obtener resultados consistentes y listos para campañas creativas.

¿Cómo generar imágenes con Stable Diffusion en Google Colab?

Antes de empezar, el enfoque usa un modelo base de Stable Diffusion 2.1 (512×512) del equipo de Stability AI. También puedes cargar un modelo personalizado con tu rostro si ya lo entrenaste y tienes el archivo .ckpt en Google Drive.

¿Qué preparar antes de ejecutar el modelo?

  • Abrir el notebook en Google Colab y ejecutar celda por celda.
  • Validar que el entorno esté en GPU.
  • Instalar la librería para conectar con Google Drive.
  • Otorgar permisos y esperar el montaje de Drive.
  • Verificar la ruta montada en la sección de archivos.

¿Cómo instalar y lanzar Automatic 1111?

  • Instalar Automatic 1111: interfaz visual de Stable Diffusion.
  • Ejecutar la instalación de requerimientos extra y esperar el indicador en verde.
  • Seleccionar Stable Diffusion 2.1 (512×512) o pegar la ruta del archivo .ckpt si usas tu modelo.
  • Lanzar el servidor y abrir la URL de la interfaz web sin user ni password.

¿Cómo escribir prompts efectivos y evitar errores comunes?

Los modelos text to image son muy literales: un pequeño typo cambia el resultado. Especifica sujeto, encuadre, estilo y calidad; y usa negative prompts para excluir elementos no deseados.

¿Qué incluir en el prompt y en el negative prompt?

  • Sujeto: “un retrato de un astronauta” o “a female astronaut”.
  • Atributos: “sin casco”, view frontal, middle shot.
  • Estilo y calidad: hiperrealista, 4K, high definition.
  • Exclusiones en negative prompts: borroso, casco, letras, dedos, “algo feo”.

¿Cómo ajustar parámetros para calidad y control?

  • Subir los sampling steps a 30: tarda más, pero puede mejorar la calidad.
  • Usar el parámetro de control de precisión/creatividad: más alto = menos creativo y más fiel al prompt; un valor de 10 funciona bien.
  • Resolución por defecto: 512×512; cambiar width a 768 cuando busques otra composición.

¿Cómo iterar y centrar el encuadre?

  • Indicar “centrado” en el prompt para mejorar el encuadre.
  • Repetir la generación y ajustar hasta limpiar el rostro y eliminar letras.
  • Usar seed -1 para resultados aleatorios; fijar una seed concreta para replicar una imagen.

¿Cómo guardar, reutilizar y escalar resultados en Automatic 1111?

Cuando obtengas una imagen sólida, guárdala y nómbrala para reutilizarla y documentar tu flujo. Si quieres variaciones, cambia la seed o las dimensiones y vuelve a generar.

¿Qué flujo de iteración recomienda el instructor?

  • Generar un primer resultado con prompt claro.
  • Corregir typos y refinar negative prompts.
  • Ajustar sampling steps y el parámetro de precisión/creatividad.
  • Cambiar seed para explorar opciones o fijarla para replicar.
  • Guardar versiones útiles, por ejemplo: “astronauta campaña”.

¿Ya creaste tu avatar para la campaña del Space Program? Prueba con científicas, ingenieros, estudiantes de Platzi o incluso seres de otro planeta. Comparte tu resultado y deja retroalimentación a tus compañeros y compañeras.

      Generar imágenes con Stable Diffusion en Colab