Contenido del curso
Práctica con Modelos de IA
Prototipado y marketing de productos
Innovando e iteración de productos con IA
Innovando e incorporación en flujos de producción
- 17

Retoque de imágenes IA con Photopea
10:41 min - 18

Crea y edita fotos de producto con ChatGPT
07:24 min - 19

ChatGPT como asistente creativo para generar imágenes profesionales
10:19 min - 20

Iterar imágenes con ChatGPT y corregir detalles en Photoshop
06:32 min - 21

Creación de GPTs para Prompts en MidJourney y Stable Diffusion
07:20 min - 22

Uso Avanzado de IA Generativa en Marketing y Creatividad
05:28 min - 23

Cambio de rostros y clonación de voz con IA
Viendo ahora
Futuro y cierre
Cambio de rostros y clonación de voz con IA
Resumen
Los modelos de inteligencia artificial van mucho más allá de generar imágenes para campañas o piezas creativas. Hoy existen herramientas que cambian rostros, clonan voces y procesan texto, y conocerlas te permite entender qué consumes, qué creas y qué implicaciones éticas trae cada decisión.
Esto te interesa si trabajas en marketing, diseño, contenido o producción audiovisual y quieres mantenerte al día con lo que se está desarrollando en text to image, image to image, image to video y text to speech.
Cómo puedes reemplazar un rostro en una imagen con IA
Una de las capacidades más sorprendentes hoy es tomar una fotografía tuya y fusionarla con una imagen de referencia, conservando la composición original.
En la herramienta VidQue, hermana de Vidnoz y especializada en fotografía con IA, el flujo es directo. Tomas una imagen que te guste, por ejemplo Gandalf de El Señor de los Anillos, subes una foto tuya tomada con el celular y el modelo coloca tu rostro sobre el personaje en alta definición. En el ejemplo se hizo con tres referencias seguidas: Gandalf, Iron Man y Legolas.
¿Para qué sirve cambiar un rostro con IA? Para producción de marketing donde necesitas probar modelos sin sesiones fotográficas nuevas, para catálogos de moda con prendas ya creadas, o para iterar conceptos creativos antes de producirlos.
El punto importante es que con suficiente iteración, el resultado puede quedar prácticamente perfecto, lo que abre preguntas sobre qué es real y qué no en lo que vemos a diario.
Qué es Hugging Face y por qué deberías explorarlo
Mantenerte a la vanguardia exige un lugar donde se concentre lo que se está construyendo. Ese lugar es Hugging Face, una plataforma donde puedes subir tus propios modelos, acceder a los de otras personas, leer documentación y probar resultados antes de integrarlos a tu trabajo.
Dentro de la sección de modelos encuentras categorías organizadas por tipo de tarea:
- Text to image con opciones como Flux y Stable Diffusion.
- Image to text, image to image e image to video.
- Text to speech y text to audio para trabajo con voz y sonido.
Cada modelo trae su ficha con parámetros, ejemplos y casos de uso. Esa lectura es la que te da contexto del estado del arte y te ayuda a decidir qué herramienta sirve para qué proyecto.
¿Qué es Hugging Face en una frase? Es un repositorio colaborativo de modelos de inteligencia artificial donde puedes explorar, probar y publicar modelos de imagen, texto, audio y video.
Cómo funciona la clonación de voz con IA
La clonación de voz permite tomar un fragmento de audio de una persona y generar nuevas frases con esa misma voz. En el recorrido se probó un modelo llamado Tony, un voice clone optimizado principalmente para inglés.
El ejercicio fue concreto. Se eligió una voz ya entrenada, la de Heath Ledger como el Joker en El Caballero de la Noche, partiendo de un fragmento corto: "It's simple: kill the Batman". Luego se ingresó un nuevo texto, "La inteligencia artificial es la siguiente arma del Joker en contra del horrible Batman", el modelo lo procesó en la nube y devolvió el audio en inglés con la voz clonada: "Artificial intelligence is the Joker's next weapon against the horrible Batman".
¿La clonación de voz funciona en español? El modelo Tony está optimizado para inglés, pero en Hugging Face encuentras alternativas entrenadas en otros idiomas. Vale la pena buscar uno afinado para el idioma que necesites.
Qué preguntas éticas abren estos modelos
Reemplazar un rostro o clonar una voz con calidad casi perfecta no es un truco menor. Cambia la forma en que consumimos noticias, cómo verificamos lo que vemos y cómo se construye la confianza en la comunicación.
Por eso conviene asumir tres prácticas mientras exploras:
- Probar los modelos para entender sus límites reales, no solo lo que se promete en redes.
- Leer la documentación de cada modelo en Hugging Face para conocer parámetros y casos de uso.
- Compartir hallazgos cuando encuentres un modelo nuevo o inesperado, porque informarnos colectivamente es parte del proceso.
Si encuentras un modelo raro, uno que no sabías que existía o uno que te sorprendió por su resultado, cuéntalo en los comentarios y comparte el enlace para que más personas lo prueben.