IA para animar rostros que hablan

cerebro cibernetico inteligencia artificial

En los últimos años, las animaciones generadas por computadora de animales y humanos se han vuelto cada vez más detalladas y realistas. Sin embargo, producir animaciones convincentes de la cara de un personaje mientras habla sigue siendo un desafío clave, ya que generalmente implica la combinación exitosa de una serie de diferentes elementos de audio y video.

Siguiendo una lógica similar a la de los ya conocidos deepfakes

Un nuevo modelo de IA diseñado por científicos informáticos de la India puede utilizarse para integrar grabacione de audio con los movimientos de una cabeza. Esta tecnología podría usarse para crear avatares virtuales, asistentes digitales y películas animadas más convincentes.


Banner_frasco-suscripcion-800x250

Animación realista de rostros en base a un audio con voz

«Para una experiencia de visualización agradable, la percepción del realismo es de suma importancia, y a pesar de los recientes avances de la investigación, la generación de una cara parlante realista sigue siendo un problema de investigación desafiante», comentó a TechXplore Brojeshwar Bhowmick, uno de los investigadores que a cargo a cabo el estudio. «Junto con la sincronización precisa de labios, la animación realista de la cara parlante requiere otros atributos de realismo, como parpadeos naturales de los ojos, movimientos de la cabeza y preservación de la información de identidad de las caras objetivo arbitrarias».

La mayoría de los métodos basados en el habla existentes para generar animaciones faciales se centran en garantizar una buena sincronización entre los movimientos de los labios y el habla grabada, preservar la identidad de un personaje y garantizar que ocasionalmente parpadee. Algunos de estos métodos también intentaron generar movimientos convincentes de la cabeza, principalmente emulando los realizados por hablantes humanos en un breve video de entrenamiento.

«Estos métodos derivan el movimiento de la cabeza del video de conducción, que puede no estar correlacionado con el contenido actual del discurso y, por lo tanto, parece poco realista para la animación de discursos largos», dijo Bhowmick. «En general, el movimiento de la cabeza depende en gran medida de la información prosódica del discurso en una ventana de tiempo actual», agregó.

Conoce más aquí


Reciba las últimas noticias de la industria en su casilla:

Suscribirse ✉