Meta ha desarrollado una inteligencia artificial que permite identificar más de 4 mil idiomas. De esta manera, la empresa quiere preservar las lenguas que está por desaparecer, a la vez que permiten crear texto a voz y viceversa. Actualmente, ya cuentan con más de 1.100 modelos con esta tecnología.
“Muchos de los idiomas del mundo están en peligro de desaparecer, y las limitaciones de la tecnología actual de generación y reconocimiento de voz solo acelerarán esta tendencia. Queremos facilitar a las personas el acceso a la información y el uso de dispositivos en su idioma preferido, y hoy anunciamos una serie de modelos de inteligencia artificial (IA) que podrían ayudarlos a hacer precisamente eso”, señala Meta.
MIRA: Así sonaría ‘Yesterday’ de los Beatles si la cantase Freddy Mercury, según una IA | Video
Estos modelos también permiten crear textos a partir de voz y viceversa. “Los modelos Massively Multilingual Speech (MMS) amplían la tecnología de texto a voz y de voz a texto de alrededor de 100 idiomas a más de 1.100, más de 10 veces más que antes, y también pueden identificar más de 4.000 idiomas hablados, 40 veces más que antes”, agrega.
La compañía también indica que esta tecnología podría utilizarse para interacciones de realidad virtual, realidad aumentada, o hasta en mensajería instantánea, pues la traducción sería casi de inmediato. Además, Meta asegura que los modelos serán de código abierto, por lo que otros investigadores podrán utilizarlo para los idiomas que deseen.
MIRA: “Esta medicina llamada Inteligencia Artificial”, por Omar Flórez | OPINIÓN
¿Cómo se desarrolló está inteligencia artificial?
Según la compañía, se entrenó gracias a los libros que se han traducido a más idiomas. “Recopilar datos de audio para miles de idiomas fue nuestro primer desafío porque los conjuntos de datos de voz más grandes que existen cubren 100 idiomas como máximo. Para superar esto, recurrimos a textos religiosos, como la Biblia, que se han traducido a muchos idiomas diferentes y cuyas traducciones se han estudiado ampliamente para la investigación de traducción de idiomas basada en texto”, afirma.
Debido a que los textos religiosos suelen ser grabados para que las personas con discapacidades visuales puedan escucharlas, también se consiguió mucho material en audio. “Estas traducciones tienen grabaciones de audio disponibles públicamente de personas que leen estos textos en diferentes idiomas. Como parte del proyecto MMS, creamos un conjunto de datos de lecturas del Nuevo Testamento en más de 1.100 idiomas, que proporcionó un promedio de 32 horas de datos por idioma”, añade.
Pese a que la mayoría son de contenido religioso, Meta afirma que esto no influye en el modelo de IA. “Al considerar grabaciones sin etiquetas de otras lecturas religiosas cristianas, aumentamos la cantidad de idiomas disponibles a más de 4000. Si bien estos datos son de un dominio específico y, a menudo, los leen hablantes masculinos, nuestro análisis muestra que nuestros modelos funcionan igualmente bien para voces masculinas y femeninas. Y aunque el contenido de las grabaciones de audio es religioso, nuestro análisis muestra que esto no sesga el modelo para producir un lenguaje más religioso”, concluye.
TE PUEDE INTERESAR
- OpenAI lanza curso gratis para aprender una profesión que paga miles de dólares por usar bien ChatGPT
- Así es BratGPT, el gemelo malvado de ChatGPT que te insulta y te recuerda que algún día las IA dominarán el mundo
- Usan el reconocimiento facial impulsado por IA para buscar criminales en concierto de Beyoncé
Contenido sugerido
Contenido GEC