Crea videos con IA usando D-ID y Adobe Podcast

Taller de Creación de Contenido con Inteligencia Artificial

Contenido del curso

¡Conoce el proyecto y comienza a crear!

Crea contenido con IA

Crea videos animados con Inteligencia Artificial

Tomar examen

Crea videos con IA usando D-ID y Adobe Podcast

Resumen

Crear un video con inteligencia artificial ya no requiere un estudio de producción ni un equipo técnico enorme. Con la combinación correcta de herramientas, puedes generar imágenes, mejorar audios y animar avatares en minutos. Aquí verás cómo armar una campaña completa partiendo de una imagen creada en Stable Diffusion, un guion ajustado en ChatGPT y un avatar animado en D-ID.

¿Cómo se ajusta un guion generado por ChatGPT para una campaña creativa?

El punto de partida es un copy base entregado por ChatGPT, pero ese texto rara vez sale listo para publicar. En Pi Marketing, el equipo lo personaliza para alinearlo con los objetivos de la campaña.

El ajuste consiste en sumar enlaces relevantes, afinar el tono y dirigir el mensaje hacia la audiencia específica. La idea es usar la IA como una base de trabajo, no como una salida definitiva.

Piensa en el guion como un borrador que tu equipo creativo pule. Esa capa humana es la que convierte un texto genérico en una pieza con personalidad de marca.

¿Para qué sirve ChatGPT en una campaña de marketing? Genera la base del texto o copy que luego el equipo ajusta con enlaces, tono y dirección estratégica para conectar con la audiencia.

¿Cómo mejorar la calidad de un audio con Adobe Podcast?

Cuando Camila, la astronauta en órbita, envía la grabación desde el centro espacial, el audio no llega con calidad de estudio. Ahí entra Adobe Podcast, una herramienta apalancada con inteligencia artificial que limpia y mejora grabaciones en segundos.

El flujo es simple:

Arrastra o sube el archivo de audio a la plataforma.
Espera a que la IA procese y limpie la grabación.
Descarga el resultado con calidad profesional.

Lo interesante es que el audio sale como si se hubiera grabado en un estudio, sin tener que pasar por mezcla manual ni postproducción tradicional.

¿Qué tipo de audios puedes mejorar con esta herramienta?

Funciona muy bien con voces grabadas en condiciones poco ideales: ruido de fondo, micrófonos básicos o ambientes con eco. Para una campaña donde el realismo de la voz importa, este paso es clave antes de animar el avatar.

¿Cómo crear un avatar animado con D-ID a partir de una imagen?

D-ID es la herramienta que une la imagen generada en Stable Diffusion con el audio mejorado en Adobe Podcast. El resultado es un avatar que habla, mueve los labios y transmite el mensaje de la campaña.

Funciona con un modelo de pago, pero ofrece créditos gratuitos en su versión inicial para que puedas probarla sin costo. Cada video generado consume créditos según su duración.

El proceso para armar el video es directo:

Agrega un nuevo avatar y carga la imagen creada en Stable Diffusion desde la sección Pictures.
Sube el audio limpio con la opción upload your voice.
Genera el video y espera a que el render termine.

En el ejemplo, el video resultante dura 27 segundos y consume dos créditos. El avatar reproduce el guion de la campaña del Space Program de Platzi, invitando a la comunidad a unirse en platzi.com/space.

¿Qué hace D-ID con una imagen estática? La convierte en un avatar animado que sincroniza labios y expresiones con un audio cargado o con un texto convertido a voz mediante IA.

¿Qué es text to speech y cómo funciona en español?

D-ID también incluye un modelo text to speech, que toma un guion escrito y lo convierte en voz hablada por el avatar. La mayoría de estos modelos están optimizados para inglés, pero ya existen opciones que funcionan en español.

El resultado en español todavía es limitado: la voz suena menos natural y carece de la emoción de una locución humana. Aun así, es un avance importante para producir contenido rápido cuando no tienes acceso a un locutor.

Si tu campaña necesita carga emocional, conviene usar una voz real mejorada con Adobe Podcast. Si buscas velocidad y volumen, text to speech cumple.

¿Qué herramientas componen el flujo completo de creación de video con IA?

El pipeline que se trabaja en la clase combina cuatro piezas que se conectan entre sí:

Stable Diffusion: genera la imagen base del avatar.
ChatGPT: produce el copy o guion inicial de la campaña.
Adobe Podcast: mejora la calidad del audio grabado por una persona real.
D-ID: anima la imagen y la sincroniza con el audio o con un texto convertido a voz.

Cada herramienta resuelve una parte específica del proceso. Juntas, te permiten lanzar una campaña completa sin un equipo de producción tradicional.

Después de generar el video, lo descargas y lo usas en redes sociales o en cualquier canal donde quieras distribuir la pieza. Y antes de presentarlo al cliente, vale la pena compartir tu propuesta con compañeros para recibir retroalimentación: qué les gustó, qué cambiarían y qué ideas suman para mejorar el resultado.

¿Cuál fue la campaña que diseñaste tú? Compártela en los comentarios y aporta ideas para las propuestas de tus compañeros.