

Escucha la noticia
Microsoft presenta sus primeros modelos de IA generativa: MAI-Voice-1 y MAI-1-preview
Resumen generado por Inteligencia Artificial
Accede a esta función exclusiva
Resume las noticias y mantente informado sin interrupciones.
Microsoft ha presentado sus dos primeros modelos de inteligencia artificial (IA), MAI-Voice-1 y MAI-1-preview, y ha explicado que pretende “orquestar” una gama de modelos especializados que satisfagan diferentes casos de uso de los usuarios para generar un valor “inmenso”.
El gigante tecnológico considera que la IA será “la puerta de entrada a un universo de conocimiento”, y ha asegurado que está centrado en crear IA aplicada como plataforma para productos que definan categorías y sean “de gran confianza”, así como sean capaces de comprender las “necesidades únicas de cada usuario”.
Newsletter El Comercio MedIA

MIRA: Día del Gamer: Perú es el país con mayor concentración del segmento ‘Gaming’ en Latinoamérica
De esta manera, Microsoft ha lanzado su primer modelo de inteligencia artificial de voz, MAI-Voice-1, que genera un audio “expresivo de alta fidelidad en escenarios con uno o varios altavoces” en menos de un segundo y con una duración de un minuto completo, según ha especificado la compañía en una publicación en su página web.
La compañía ha señalado que esta capacidad generativa utiliza una sola GPU, lo lo convierte en uno de los sistemas de voz “más eficientes” disponibles en la actualidad.

Este modelo está disponible en Copilot Daily y Podcasts, así como también se está lanzando en Copilot Labs, según ha apuntado Microsoft, donde se pueden probar demostraciones de habla expresiva y narración.
MIRA: Gemini mejora la edición de imágenes con Gemini 2.5 Flash Image, el modelo ‘nanobanana’: combina varias imágenes de forma coherente
En segundo lugar, la empresa de Redmond ha informado de que ha comenzado las pruebas públicas de MAI-1-previev en la plataforma de evaluación LMArena. Se trata de un modelo interno de expertos que ha sido preentrenado y postentrenado con aproximadamente unas 15.000 GPU Nvidia H100, por lo que está diseñado para ofrecer “potentes capacidades” a los usuarios que buscan modelos especializados en “seguir instrucciones y proporcionar respuestas útiles a consultas cotidianas”.
Asimismo, la compañía tecnológica ha indicado que en las próximas semanas implementará la versión preliminar de este modelo para ciertos casos de uso de texto en Copilot para seguir ajustándolo con los comentarios de los usuarios. La empresa liderada por Satya Nadella también ha puesto este modelo a disposición de probadores de confianza.
De esta manera, Microsoft ha apuntado que pretende “orquestar una gama de modelos especializados que satisfagan diferentes intenciones y casos de uso”, con el fin de generar un “valor inmenso” para los usuarios.
Contenido sugerido
Contenido GEC


La temporada 3 de “Record of Ragnarok” ya está en Netflix: cuándo, a qué hora y cómo ver los nuevos episodios del anime
MAG.
32 películas navideñas clásicas para ver en estas fiestas con toda la familia
MAG.
Cuánto dinero gana Donald Trump como presidente de EE. UU. y qué hace con su salario
MAG.
Se prevé más de 10 pulgadas de nieve por tormenta invernal en EE.UU.: cuáles serían los estados afectados
MAG.





