Crea imágenes tuyas en escenarios imposibles con LoRA

Curso de Generación de Imágenes con Inteligencia Artificial

Contenido del curso

Creación de Imágenes y la Inteligencia artificial

Práctica con Modelos de IA

Prototipado y marketing de productos

Innovando e iteración de productos con IA

Innovando e incorporación en flujos de producción

Futuro y cierre

24
IA para fotos de producto por dos centavos
02:11 min

Tomar examen

Crea imágenes tuyas en escenarios imposibles con LoRA

Resumen

Entrenar un LoRA con tu propio rostro te permite generar imágenes tuyas en escenarios imposibles, costosos o lejanos sin moverte de tu silla. Es una técnica útil para creadores, marcas personales y equipos de marketing que necesitan fotos consistentes sin producción fotográfica. Aquí verás el flujo completo en Fal, desde la preparación del dataset hasta la optimización del prompt.

¿Para qué sirve entrenar un LoRA con tu rostro?

Un LoRA personal abre la puerta a sesiones fotográficas virtuales en lugares y estilos que serían inviables en la vida real. Si manejas una marca personal y necesitas tu rostro en distintas piezas, alimentar un modelo con tus fotos te ahorra logística, viajes y presupuesto.

La idea es simple: entrenas el modelo con suficientes imágenes tuyas, le asignas una trigger word y luego puedes invocar tu rostro dentro de cualquier prompt.

¿Qué es una trigger word en un LoRA? Es la palabra clave que activa el modelo entrenado. Cuando la incluyes en el prompt, el sistema busca la información aprendida y genera la imagen con tu rostro. En el ejemplo se usó Felipe Solehm.

¿Cómo preparo el dataset de imágenes para entrenar el modelo?

La calidad del LoRA depende directamente de las fotos que le entregues [00:32]. La recomendación es usar alrededor de 20 imágenes variadas, que muestren tu rostro desde distintos ángulos y contextos.

Para armar tu carpeta personal, busca variedad en estos elementos:

Encuadres distintos: rostro completo, plano cerrado y cuerpo entero.
Iluminaciones diferentes: luz natural, interiores y exteriores.
Expresiones variadas: sonrisas distintas, gestos neutros y poses sentado o caminando.
Accesorios opcionales como gafas para que el modelo los reconozca.

Una vez tengas la carpeta lista, comprímela en un archivo zip. Ese archivo es el que vas a subir a Fal.

¿Cómo entreno un LoRA en Fal paso a paso?

El flujo de entrenamiento en Fal usa el módulo Flux LoRA Training [02:00]. Vas a la sección de training, seleccionas el archivo comprimido con tus fotos y le asignas un nombre que funcione como tu trigger word.

En el ejemplo se usó la frase a photo of Felipe Solehm como identificador. Después le das start y el modelo comienza a entrenar.

¿Cuánto tarda entrenar un LoRA en Fal? Entre 5 y 20 minutos aproximadamente, dependiendo de la cantidad de imágenes y de qué tan bien necesite el modelo aprender tu rostro.

Cuando termina, presionas run interface y ya puedes empezar a generar imágenes con tu rostro incrustado.

¿Cuánto cuesta generar cada imagen?

El costo por imagen es bajo: aproximadamente dos centavos de dólar por generación [03:20]. Eso convierte la experimentación en algo accesible, porque puedes probar decenas de variaciones sin preocuparte por el presupuesto.

¿Cómo escribo prompts mejores para mi LoRA?

Un prompt básico como Felipe Solehm, room, futuristic funciona, pero los resultados mejoran muchísimo cuando lo enriqueces con detalles. Aquí entra una técnica útil: apóyate en ChatGPT como copiloto de prompts.

El flujo recomendado es este:

Escribe tu idea en español de forma simple.
Pídele a ChatGPT que busque la documentación oficial de Flux en la web.
Solicita que devuelva únicamente el prompt optimizado en inglés con detalles adicionales.
Copia ese prompt y pégalo en Fal junto con tu trigger word.

El ejemplo del transcript parte de una idea sencilla, Felipe Solehm en una habitación futurista con hologramas y las palabras AI y Platzi en las paredes, y termina convertida en un prompt mucho más completo que da resultados visualmente más ricos.

¿Qué hago si la imagen sale un poco desenfocada?

Es común que la primera generación se parezca a ti pero con cierta pérdida de nitidez. La solución no es reentrenar el LoRA, sino pasar la imagen por modelos adicionales de mejora de rostro [05:40]. Esos modelos refinan los rasgos y devuelven una versión mucho más fiel a tu cara real.

¿Qué tipo de imágenes puedo crear con mi LoRA personal?

Aquí está lo interesante: una vez tienes el modelo entrenado, las posibilidades son prácticamente infinitas. Puedes ponerte como astronauta, como superhéroe o en países a los que tendrías que viajar para tomar la foto real.

Algunas ideas concretas para explorar:

Tu rostro montado en personajes de cómic o películas.
Escenarios imposibles como el espacio exterior u otros planetas.
Locaciones de viaje sin moverte de casa.
Campañas para tu marca personal con estilos visuales distintos.
Piezas publicitarias donde combinas producto y rostro en la misma imagen.

El reto que te propongo es claro: entrena tu LoRA, genera una imagen tuya en un lugar al que no podrías acceder fácilmente y compártela. Apóyate en ChatGPT para optimizar el prompt y prueba combinaciones que mezclen tu marca personal con escenarios fuera de lo común. ¿En qué escenario imposible te vas a poner primero?