Microsoft ha presentado sus dos primeros modelos de inteligencia artificial (IA), MAI-Voice-1 y MAI-1-preview, y ha explicado que pretende “orquestar” una gama de modelos especializados que satisfagan diferentes casos de uso de los usuarios para generar un valor “inmenso”.

El gigante tecnológico considera que la IA será “la puerta de entrada a un universo de conocimiento”, y ha asegurado que está centrado en crear IA aplicada como plataforma para productos que definan categorías y sean “de gran confianza”, así como sean capaces de comprender las “necesidades únicas de cada usuario”.

Newsletter El Comercio MedIA Alicia Rojas presenta una guía clara para entender (y aprovechar) la inteligencia artificial, cada jueves.

De esta manera, Microsoft ha lanzado su primer modelo de inteligencia artificial de voz, MAI-Voice-1, que genera un audio “expresivo de alta fidelidad en escenarios con uno o varios altavoces” en menos de un segundo y con una duración de un minuto completo, según ha especificado la compañía en una publicación en su página web.

La compañía ha señalado que esta capacidad generativa utiliza una sola GPU, lo lo convierte en uno de los sistemas de voz “más eficientes” disponibles en la actualidad.

Primeros modelos de lenguaje de Microsoft. / MICROSOFT.

Este modelo está disponible en Copilot Daily y Podcasts, así como también se está lanzando en Copilot Labs, según ha apuntado Microsoft, donde se pueden probar demostraciones de habla expresiva y narración.

En segundo lugar, la empresa de Redmond ha informado de que ha comenzado las pruebas públicas de MAI-1-previev en la plataforma de evaluación LMArena. Se trata de un modelo interno de expertos que ha sido preentrenado y postentrenado con aproximadamente unas 15.000 GPU Nvidia H100, por lo que está diseñado para ofrecer “potentes capacidades” a los usuarios que buscan modelos especializados en “seguir instrucciones y proporcionar respuestas útiles a consultas cotidianas”.

Asimismo, la compañía tecnológica ha indicado que en las próximas semanas implementará la versión preliminar de este modelo para ciertos casos de uso de texto en Copilot para seguir ajustándolo con los comentarios de los usuarios. La empresa liderada por Satya Nadella también ha puesto este modelo a disposición de probadores de confianza.

De esta manera, Microsoft ha apuntado que pretende “orquestar una gama de modelos especializados que satisfagan diferentes intenciones y casos de uso”, con el fin de generar un “valor inmenso” para los usuarios.