Cuando el servicio de Google Traductor insertó en su programación redes neuronales -un tipo de inteligencia artificial que aprende con la experiencia- las traducciones mejoraron de forma sorprendente. Ahora esta tecnología funciona en la aplicación móvil de la plataforma sin la necesidad de Internet ofreciendo una mejor interpretación de los textos en otros idiomas, pero es posible que también esté encontrando “mensajes ocultos” que han llamado la atención.
El sitio de “Vice” “Motherboard” informa que si intentas traducir “dog” [perro] en Google Traductor repitiendo la palabra 19 veces del maorí al inglés, la consulta sin sentido se transforma en: “Doomsday Clock es de tres minutos a las doce. Estamos experimentando personajes y un desarrollo dramático en el mundo, que indican que nos estamos acercando cada vez más al final de los tiempos y al regreso de Jesús”.
El sitio Reddit se llenó de ejemplos como este. Traducciones desde el somalí, por ejemplo, hacen referencias mitológicas de la Biblia y citan a el “nombre del Señor”, a los Deuteronomios y más. Mientras que en Twitter, las personas culpan a “fantasmas” y “demonios”, el canal de Reddit TranslateGate especulan que se trataría de textos recopilados de correos electrónicos o mensajes privados.
“Google Translate aprende de ejemplos de traducciones en la web y no usa 'mensajes privados' para llevar a cabo traducciones, ni el sistema siquiera tendría acceso a ese contenido”, dijo Justin Burr, vocero de Google, en un correo electrónico a “Motherboard”. “Esto es simplemente una función de introducir tonterías en el sistema, a lo que se genera una tontería”.
Cuando el vocero recibió un ejemplo de estas extrañas traducciones, el mismo desapareció de la plataforma.
Según el citado medio, existen muchas posibles explicaciones del por qué de este tipo de mensajes. Puede tratarse de empleados descontentos de Google, de usuarios que juegan a “sugerir una edición”. Pero el profesor asistente en Harvard Andrew Rush, que estudia el procesamiento del lenguaje natural y la traducción de computadoras, explicó que los filtros de calidad interna posiblemente detectarían manipulaciones de este tipo.
Para Rush, estas extrañas traducciones pueden estar más bien relacionadas con el cambio que aplicó Google Traductor hace algunos años, cuando comenzó a usar la técnica de “traducción automática neuronal”. Este es un sistema que se entrena con grandes cantidades de textos en un idioma y sis traducciones correspondientes en otro para crear un modelo que le permita moverse entre los dos.
Cuando el mencionado método de traducción se alimenta de insumos sin sentido, puede “alucinar” salidas extraña, como la forma en que Google DeepDream identifica y acentúa los patrones en las imágenes. “Los modelos son cajas negras, que se aprenden de tantas instancias de capacitación que puedes encontrar”, dijo Rush.
“La gran mayoría de estos se verá como el lenguaje humano, y cuando le das uno nuevo está entrenado para producir algo, a toda costa, que también se parece al lenguaje humano. Sin embargo, si le das algo muy diferente, la mejor traducción será algo fluido, pero no conectado a la entrada”.
El científico senior de BBN Technologies Sean Colbath, que se especializa en traducción automática, estuvo de acuerdo con la explicación de Rush. Añadió que los idiomas que arrojan los resultados más extraños (somalí, hawaiano y maorí) tienen cuerpos más pequeños de texto traducido que los idiomas más hablados, como el inglés o el español. Por eso utiliza como resultados textos de la Biblia, que ha sido traducida a muchos idiomas, para generar un modelo de traducción.
“Si intentaron construir un modelo con esas cosas, es posible que el modelo simplemente arroje un pase de granizo (un juego de palabras semi intencionado) y barra una parte de su entrenamiento”, dijo Colbath a modo personal. Rush concuerda con esta explicación, aunque Burr se negó a confirmar que Google utiliza este material como parte de la capacitación de Google Traductor.