14

Maximiza tu producción audiovisual con AI

5641Puntos

hace 5 días

Lo que nadie te está contando sobre herramientas AI en Producción Audiovisual.

Por: Andrés Arizmendy Benavides, Production Manager en Platzi.


Estamos en uno de los periodos de mayor transformación digital, y el campo de la producción audiovisual no se queda atrás. ¿Por qué? Porque el mercado nos exige crear contenido más rápido, más económico y con mayor alcance.

Es por esto que las herramientas de Inteligencia Artificial (AI) emergen como aliadas imprescindibles para todos los campos de la creación audiovisual, en contenidos que van desde el entretenimiento y publicidad hasta redes sociales y prensa.

Estamos hablando de tecnologías que no solo hacen el trabajo más sencillo, sino que también mejoran la calidad de lo que producimos, redefiniendo cómo se crean, editan y distribuyen contenidos audiovisuales con tecnologías como:

  • Generadores de imágenes para crear visuales impresionantes.
  • Image-to-video para generar animaciones.
  • Text-to-video para transformar ideas en acción.
  • Transcripciones automatizadas que nos ahorran tiempo en postproducción.
  • Traducciones en tiempo real que rompen barreras lingüísticas.
  • Deepfakes y clonación de voz para efectos sorprendentes

Por qué usar AI en la producción audiovisual

No se trata solo de responder a la necesidad imperante de ser más eficientes, ahorrar tiempo y reducir costos. Usar AI nos permite pensar de manera diferente y reimaginar cómo abordamos nuestros proyectos creativos y flujos de trabajo.

Al automatizar tareas repetitivas y técnicas, las herramientas de inteligencia artificial liberan a los equipos de producción para enfocarse en la narrativa, la estrategia y la generación de contenido de valor y alto impacto.

Según un informa de McKinsey & Company, las empresas que adoptan AI en sus procesos creativos pueden reducir los tiempos de producción en un 40 % y aumentar su capacidad de lanzamiento de contenido en un 20 %. Estos avances no solo aceleran la producción, sino que también abren nuevas oportunidades para la innovación.

Cómo usamos AI en el equipo de Producción de Platzi

En este artículo, te quiero compartir cómo el equipo de Production de Platzi está integrando herramientas de AI para transformar la manera en que abordamos la creación de contenido educativo y de marketing. Exploraremos el uso de:

  • MidJourney para generar fondos visuales
  • ChatGPT para escribir guiones
  • Runway para animar imágenes
  • ElevenLabs para crear voice overs realistas
  • HeyGen para doblajes sincronizados con lipsync

Descubre cómo estas herramientas están transformando nuestro flujo de trabajo y cómo pueden impactar el tuyo.

Los desafíos de la producción audiovisual de Platzi

ia-produccion-audiovisual.jpg

En Platzi, producir contenido educativo ha sido un desafío que hemos enfrentado a lo largo de los años. Combinamos creatividad, calidad técnica y eficiencia para ofrecer cursos que tengan un alto impacto educativo, audiovisual y que sean accesibles para todo tipo de estudiantes. Gracias a la inteligencia artificial, hemos logrado optimizar algunos de los procesos de producción, integrando herramientas que resuelven problemas específicos y potencian nuestras capacidades creativas.

1. Creación de fondos personalizados

Antes, generar fondos virtuales requería mucho tiempo y recursos. Herramientas como Unreal Engine, aunque robustas y precisas, eran difíciles de escalar para la cantidad de cursos que producimos.

Ahora, MidJourney nos permite crear imágenes únicas a partir de descripciones detalladas de acuerdo a las necesidades de cada curso. Podemos crear fondos que se integran fácilmente mediante chromakey, en cada clase, permitiéndonos explorar diferentes estéticas e iterarlas, cosa que antes no era posible por el tiempo que este proceso requería.

También, cuando necesitamos perfeccionar fondos de grabación, pues el espacio no es suficiente, usamos el relleno autogenerativo de Photoshop para extender o completar imágenes de manera precisa y natural. El resultado: fondos impecables, con menos esfuerzo.

2. Generación de planos de apoyo (b-roll)

Algo en lo que nos hemos visto beneficiados altamente, es la posibilidad de generar planos de apoyo a partir de imágenes de archivo o generadas con Midjourney. En un rodaje convencional, esto tomaría un tiempo adicional y en esta industria el tiempo es dinero.

Con Runway, transformamos imágenes generadas con MidJourney o fotografías de referencia en videos dinámicos con estilos predeterminados o que reproducen en cierta medida el realismo de las fotografías. Esto nos permite complementar el contenido de las clases, dar dinamismo a nuestros anuncios y publicaciones en redes sociales. Además, Runway agiliza tareas como la eliminación de fondos y la animación de elementos, optimizando aún más nuestros procesos de producción.

3. Escritura de guiones más ágil

La escritura de guiones y escaletas es fundamental para el desarrollo de los contenidos que creamos en el equipo. Antes, este era un proceso que podía tomar días, entre escritura de borradores y correcciones.

Hoy, con ChatGPT, generamos borradores iniciales en minutos, basándonos en ideas y guiones anteriores, que sirven de referencia para mantener un tono consistente y asegurar un contenido de calidad en todos los casos. Esto nos brinda una base sólida para trabajar y sobre la que trabajaremos nuestro guion final.

4. Actualización de contenidos sin complicaciones

Uno de los desafíos más grandes que enfrentamos tiene que ver con la actualización de contenidos específicos dentro de una clase, pero ahora es más sencillo gracias a** Eleven Labs**. Con la ayuda de este modelo, **clonamos las voces de los profesores (con su autorización) **para añadir o modificar fragmentos de audio sin necesidad de llevarlos de regreso a estudio o regrabar.

Cuando necesitamos adaptar cursos a un idioma que no sea español, usamos HeyGen, que dobla el contenido a múltiples idiomas con lipsync, dándonos oportunidad de llegar a estudiantes en todas partes del mundo.

5. Mejora en la accesibilidad y calidad del audio

La accesibilidad es una prioridad para nosotros. Descript es una herramienta que nos permite transcribir clases, generar subtítulos sincronizados y traducir contenido rápidamente. Además, estas transcripciones son una excelente base para blogs y piezas de marketing.

Si enfrentamos problemas de ruido o calidad de audio, Adobe Podcast limpia y mejora las grabaciones, garantizando un sonido profesional.

¿Cómo funcionan las herramientas de AI en la producción audiovisual?

produccion-video-inteligencia-artificial.jpg

1. MidJourney

Utiliza redes neuronales para interpretar descripciones de texto y generar imágenes únicas. Los usuarios introducen prompts específicos que definen elementos visuales como estilo, composición y colores, y la AI crea imágenes que se pueden personalizar aún más mediante iteraciones. Te recomiendo el Curso de creación de imágenes con Midjourney para profundizar en el uso de esta herramienta.

2. Runway

Combina modelos de deep-learning para transformar imágenes en videos o animaciones. Sus funcionalidades incluyen eliminación de fondos, ajustes de color automáticos y herramientas de animación, diseñadas para flujos de trabajo rápidos. Podrías ver el Taller de creación de contenido con AI si te interesa conocer más acerca de esta herramienta y afines.

3. ChatGPT

Basado en el modelo GPT-4, procesa entradas de texto para generar respuestas detalladas y coherentes. En producción, es ideal para estructurar ideas, desarrollar borradores y crear versiones iniciales de guiones o escaletas. También se pueden crear ChatGPTs a medida usando prompts personalizados e insumos generados previamente por el equipo. Dale un ojo al Curso de ChatGPT para descubrir todo el potencial de este modelo.

4. Eleven Labs

Emplea un modelo de clonación de voz que analiza grabaciones de audio para replicar el tono, acento y cadencia de un locutor. Los usuarios pueden introducir texto para generar audio en la voz clonada, ahorrando tiempo en locuciones.

5. Descript

Utiliza tecnología de reconocimiento de voz para transcribir audio/video y ofrece una interfaz intuitiva para editar texto, que afecta directamente el contenido multimedia asociado. Además, permite crear subtítulos y traducirlos automáticamente.

6. HeyGen

Utiliza tecnología de IA para generar doblajes en múltiples idiomas con sincronización automática de labios. El usuario carga el video y selecciona el idioma deseado, y la herramienta ajusta el doblaje para que coincida perfectamente con el movimiento de los labios.

7. Adobe Podcast

Emplea un modelo de limpieza de audio que elimina ruidos de fondo, ajusta el nivel de las voces y mejora la claridad general. Funciona a través de una interfaz intuitiva donde se suben archivos de audio para procesamiento automático.

8. Relleno autogenerativo de Photoshop

Basado en modelos de AI, analiza las áreas seleccionadas de una imagen para generar contenido adicional que coincide en color, textura y estilo. Es ideal para extender fondos o eliminar elementos no deseados mientras mantiene una composición natural.

La AI como aliada estratégica en producción audiovisual

audiovisual-production-ai.jpg
La inteligencia artificial es mucho más que una solución técnica o una herramienta, es un catalizador para la innovación. Es un motor de cambio que está revolucionando la producción audiovisual, permitiendo a los equipos enfocarse en lo que realmente importa: contar historias relevantes, explorar nuevos formatos y conectar con las audiencias de formas más profundas.

Al automatizar tareas repetitivas y complejas, la AI libera tiempo y recursos que pueden destinarse a la creatividad y la estrategia.

Los desafíos de la AI: ética y habilidad

Aunque poderosa, la AI plantea retos importantes que no podemos ignorar. La calidad de los resultados depende directamente de la habilidad del equipo para usar estas herramientas y de la creatividad con la que las implementen. Además, surgen preguntas clave sobre su impacto, como:

  • Propiedad intelectual: ¿quién es el autor de una obra generada en colaboración con AI?
  • Privacidad: ¿cómo afecta la clonación de voces a los derechos de los locutores?
  • Roles tradicionales: ¿qué cambios traerá la AI para los profesionales en producción audiovisual?

Estos desafíos no son solo técnicos; también requieren un enfoque ético y reflexivo para asegurar que estas tecnologías se utilicen de manera responsable.

Un enfoque estratégico para aprovechar el potencial de la AI

A pesar de los retos, los beneficios de la AI son innegables. Para aprovecharlos al máximo, es esencial adoptar un enfoque estratégico que incluya:

  1. Capacitación continua: dominar herramientas como MidJourney, Runway o ChatGPT requiere aprendizaje constante.

  2. Implementación ética: integrar estas tecnologías con un respeto claro por los derechos y la privacidad de los involucrados.

  3. Enfoque en el valor humano: mantener el foco en lo que realmente importa: la creatividad, la narrativa y el impacto en las audiencias.

Un futuro diverso, inclusivo y creativo

A medida que avanzamos hacia 2025, la producción audiovisual enfrenta un futuro emocionante. Las herramientas de inteligencia artificial seguirán evolucionando, no solo para hacer los procesos más rápidos y eficientes, sino también para abrir nuevas posibilidades creativas.

En Platzi, hemos visto cómo la AI puede transformar las historias que contamos y cómo las contamos, creando un impacto significativo tanto en nuestra manera de trabajar como en nuestra relación con nuestros estudiantes.

El futuro de la producción audiovisual será más inclusivo, diverso y creativo, gracias al poder de la AI

Te dejo cuatro contenidos que realizamos para YouTube en los que nos preguntamos por el alcance de la AI en diferentes campos. Me gustaría leer en los comentarios cuál fue tu favorito.

Si te interesa iniciar tu carrera en producción audiovisual, te comparto esta ruta de aprendizaje en Introducción a la Creación Audiovisual.

También, te invito a seguir mi proyecto Liminal Alterity, en el que exploro la generación de autoretratos y ensoñaciones poéticas a través del uso de AI.
Liminal-alterity.jpg

Andrés
Andrés
aarizmendyb

5641Puntos

hace 5 días

Todas sus entradas
Escribe tu comentario
+ 2
Ordenar por:
2
9503Puntos
4 días

Cómo creas las imagenes que publicas en IG? puedes compartir algo de workflow?

1
5641Puntos
4 días

Por supuesto, Sebas. Siempre parto de una idea o imagen que tengo en mente. Escribo varias descripciones que luego llevo a Midjourney donde genero varias opciones que luego itero hasta llegar a una imagen que refleje lo que me interese. Esa imagen la llevo a Photoshop y hago algunos ajustes, que incluyen acentuar los rasgos o revisar la expresión de los retratos. Luego hago un upscale y reviso que la imagen tenga buena calidad. Ese sería un overview del workflow.

2
27007Puntos
4 días

Gracias por compartir tu conocimiento Ariz. 💚
De los contenidos de YouTube mi favorito fue el de cómo AI está destruyendo la industria musical.🌟

1
5641Puntos
4 días

Super, Caro. Con el mayor de los gustos. También me pareció un gran contenido acerca de producción musical.

2
2545Puntos
4 días

Wow, genial! no sabía que existían tantas herramientas, muchas gracias por este texto revelador.

1
5641Puntos
4 días

Que bueno saber que te resultó revelador este contenido.

2
5053Puntos
4 días

Excelente, que buena información. Gracias por esto!

1
5641Puntos
4 días

Me alegra que te haya gustado, con gusto.