Google ha presentado Imagen Video, un sistema de generación de video de alta calidad a partir de texto, capaz de generar una amplia variedad de videos y animaciones en distintos estilos artísticos.
Imagen Video parte del trabajo realizado por Google en Imagen, el modelo basado en Inteligencia Artificial (IA) capaz de crear imágenes de gran realismo a partir de breves descripciones de texto que la compañía presentó en mayo.
MIRA: Inteligencia artificial es capaz de convertir cualquier palabra en un Pokémon
El nuevo sistema se basa en una cascada de modelos de difusión de video y tiene capacidad para “generar videos de alta definición con alta fidelidad de fotogramas, fuerte consistencia temporal y comprensión profunda del lenguaje”, como detalla la compañía tecnológica en el texto de la investigación.
A partir de una descripción breve en texto, este sistema genera videos de alta definición de 1.280 x 768 píxeles a 24 fotogramas por segundo (fps) de unos 5,3 segundos de duración y con una densidad de 126 millones de píxeles, aproximadamente.
MIRA TAMBIÉN: Facebook introduce un sistema de inteligencia artificial para administrar la sección de noticias
Para conseguir este resultado, los investigadores de Google han entrenado el sistema con una base de datos interna de 14 millones de parejas de video y texto y 60 millones de parejas de imagen y texto. También han recurrido a la base de datos pública LAION y sus 400 millones de conjuntos de datos de imagen y texto. El procesamiento de los datos ha permitido redimensionar las imágenes y los videos y alinearlos con los textos.
Los investigadores destacan algunas de las características particulares que presenta su sistema frente a otras propuestas, como la capacidad de generar videos con distintos estilos artísticos; la comprensión de la estructura tridimensional, pese a fallar un poco en la consistencia durante la rotación de un objeto; y de generar texto animado en una diversidad de estilos.
MIRA: Nueva IA de Meta (Facebook) es capaz de crear videos a partir de descripciones de texto
Meta también ha presentado recientemente ‘Make-A-Video’, su sistema de inteligencia artificial capaz de generar un video corto de alta calidad a partir de una descripción en texto, que se basa en la tecnología de generación de imágenes ‘Make-A-Scene’.
VIDEO RECOMENDADO
TE PUEDE INTERESAR
- “Un ingeniero de la ciberseguridad en el Perú podría ganar entre S/. 5 ó 6 mil al mes”
- Vehículos autónomos: así funciona la tecnología que hace posible que un auto no requiera conductor
- Xiaomi 12T Pro unboxing: nuevo buque insignia, nueva carcasa y nuevo cargador (y vaya qué cargador)
- Ataque a Uber: ¿cómo operan los hackers como Lapsus$, que ponen en jaque a compañías internacionales?
Contenido sugerido
Contenido GEC