VASA: la herramienta IA de Microsoft para hacer avatares realistas, expresivos y sincronizados en los vídeos

La nueva tecnología de Microsoft requiere solo una imagen estática un fragmento de audio con voz para crear avatares realistas cuya sincronización representa “el gran espectro de emociones y matices faciales”, según el blog oficial de la compañía.

Microsoft corrigió importante fallo de seguridad que comprometió archivos y contraseñas de sus empleados
Google busca competir con Amazon y Microsoft con su primera CPU basada en Arm

Conforme a los criterios de

VASA es un programa de Microsoft que permite crear avatares realistas a partir de fotografías. — VASA es un programa de Microsoft que permite crear avatares realistas a partir de fotografías.
/ MICROSOFT

Agencia Europa Press

Agencia Europa Press

18/04/2024 09H31

Microsoft ha presentado su trabajo en un nuevo modelo de inteligencia artificial (IA) que dota de expresividad a los avatares realistas mientras aparecen hablando en vídeos generaor a partir de una imagen estática y un clip de voz.

VASA es la propuesta de Microsoft para generar rostros virtuales que hablan y gesticulan con gran expresividad y realismo en tiempo real, en las que el movimiento de los labios está “exquisitamente sincronizado con el audio”.

Newsletter El Comercio MedIA

Alicia Rojas

Alicia Rojas presenta una guía clara para entender (y aprovechar) la inteligencia artificial, cada jueves.

MIRA: Los chatbots y sus respuestas extrañas: ¿por qué lo hacen y cómo impacta en el usuario?

Los rostros que simulan ser personas reales han sido generados por herramientas de IA StyleGAN2 y DALL·E-3, pero ninguna de ellas se corresponde a una identidad real, como matiza la compañía tecnológica.

Este realismo se refuerza con la sincronización y “el gran espectro de emociones y matices faciales” que combina con el movimiento natural de la cabeza, como explica en su blog oficial.

VASA requiere solo una imagen estática un fragmento de audio con voz para crear vídeos con un tamaño de 512 x 512 píxeles a 45 fotogramas por segundos en el modo ‘offline’, aunque ‘online’ soporta 40fps con una latencia de 170ms. La compañía lo ha evaluado con un ordenador de escritorio equipado con una GPU NVIDIA RTX 4090.

Microsoft ha asegurado que no planea lanzar esta la demo de esta herramienta dado los potenciales riesgos que tiene para su maluso en la suplantación de personas reales.

TAGS

Microsoft

VIDEO RECOMENDADO

¿Qué es la inteligencia artificial?

¿Qué es la inteligencia artificial?

TE PUEDE INTERESAR

Noticias Sugeridas

El cometa 3I/ATLAS vuelve a activarse mientras se acerca a la Tierra: detectan dos colas y un misterioso ‘latido’ que intensifica su brillo

Noticias Sugeridas

La temporada 3 de “Record of Ragnarok” ya está en Netflix: cuándo, a qué hora y cómo ver los nuevos episodios del anime

Noticias Sugeridas

32 películas navideñas clásicas para ver en estas fiestas con toda la familia

Noticias Sugeridas

Cuánto dinero gana Donald Trump como presidente de EE. UU. y qué hace con su salario

Noticias Sugeridas

Se prevé más de 10 pulgadas de nieve por tormenta invernal en EE.UU.: cuáles serían los estados afectados

Noticias Sugeridas

Estos son todos los estados que se quedarían sin fondos para SNAP por no obedecer una orden de Trump