Nuevas funciones de Kaiber: Storyboard y Motion

Clase 15 de 17Curso de Inteligencia Artificial para Content Marketing

Resumen

Crear animaciones con inteligencia artificial ya no requiere conocimientos avanzados de edición. Kaiber ofrece múltiples formas de generar videos a partir de texto, imágenes, clips existentes o incluso pistas de audio, y cada método produce resultados sorprendentemente distintos. A continuación se exploran las herramientas principales de esta plataforma y las diferencias prácticas entre sus modos de generación.

¿Cuál es la diferencia entre Flipbook y Motion en Kaiber?

Kaiber presenta dos tipos de animación que conviene entender antes de crear cualquier proyecto.

  • Flipbook genera videos con menos cuadros por segundo, lo que produce un efecto de salto entre imágenes conforme avanza la reproducción. Es más rápido de procesar y consume menos créditos —apenas cuatro para un video de prueba de cuatro segundos— [1:03].
  • Motion es el modo más reciente de la plataforma y genera animaciones mucho más fluidas. A cambio, el tiempo de renderizado es mayor y el costo se eleva considerablemente: treinta y dos créditos por el mismo video de cuatro segundos [3:08].

Para comparar ambos métodos se utilizó el mismo prompt —una mujer con el pelo ondeándose al viento y nubes en movimiento— junto con el estilo Entergalactic, sin movimiento de cámara y con un valor de Evolve en cuatro. El parámetro Evolve controla cuánta libertad creativa tiene la IA para transformar la imagen a lo largo del video; valores bajos mantienen mayor fidelidad al fotograma inicial, mientras que valores altos permiten cambios más drásticos [2:22].

¿Cómo influyen los settings de video en el resultado?

Al configurar cada generación se puede elegir la relación de aspecto (en este caso dieciséis nueve), la duración del clip, el movimiento de cámara —zoom in, rotación o desplazamiento lateral— y el nivel de Evolve. Estos ajustes determinan tanto la calidad visual como el consumo de créditos, por lo que conviene experimentar con valores moderados antes de invertir en renders largos.

¿Cómo funciona la generación a partir de una imagen y el Storyboard?

Kaiber permite subir una fotografía como punto de partida. En la demostración se cargó una foto personal y se escribió el prompt "man dancing in a neon jungle", acompañado de indicaciones de estilo: animación clásica en 2D, estilo cartoon, ultradetallado y colorido [4:18]. Se activó la opción que coloca la foto original como primer frame, de modo que el espectador observa la transformación en tiempo real.

Con el Evolve elevado a siete, la IA se tomó más libertades: cambió el tono de piel, modificó el aspecto del personaje y el fondo presentó saltos notables. Sin embargo, esto abrió la puerta a una función poderosa: el Storyboard [5:38].

¿Qué permite la función Storyboard?

El Storyboard encadena varias escenas en un solo video manteniendo coherencia de estilo. Tras generar la primera escena, se escribe un segundo prompt —por ejemplo, el mismo hombre bailando bajo el agua— conservando las mismas indicaciones visuales. Kaiber genera una transición suave entre ambas escenas sin cortes visibles, lo que resulta ideal para narrativas con varios actos [6:52].

¿Qué opciones existen para transformar video y crear animaciones audiorreactivas?

Otra posibilidad es transformar un video existente. Se sube un clip —en la prueba, una pareja bailando— y se aplica un estilo nuevo: animación clásica en 2D con luces de neón y estética anime. El tamaño, la duración y el movimiento quedan determinados por el archivo original; solo se ajusta el Evolve, que en este caso se dejó en dos para mantener fidelidad [8:14]. El resultado fue visualmente llamativo, aunque la IA generó artefactos cuando el rostro de uno de los personajes dejaba de ser visible para la cámara.

La última función destacada es la generación audiorreactiva [9:28]. Se sube una pista de audio y Kaiber crea una animación que reacciona al ritmo de la música. Se configura un parámetro adicional que define qué tanto la animación se ajusta al audio: máxima reacción, media o nula. En la prueba se solicitó un grupo de amigos bailando de noche en calles con semáforos, estilo cartoon clásico en 2D, con zoom in, rotación en sentido de las manecillas del reloj y Evolve en seis. El nivel de reactividad al audio se dejó en medio.

El video resultante incorporó todos los elementos del prompt, rotó como se indicó y sincronizó los cambios visuales con la música, produciendo un resultado dinámico y coherente.

Ahora es tu turno: comparte tus propias creaciones en los comentarios, experimenta con cada modo de generación y sobre todo diviértete en el proceso.