El gigante tecnológico ha hecho su ingreso a la inteligencia artificial con sus propios modelos. (Foto: AFP)
El gigante tecnológico ha hecho su ingreso a la inteligencia artificial con sus propios modelos. (Foto: AFP)

Escucha la noticia

00:0000:00
Microsoft presenta sus primeros modelos de IA generativa: MAI-Voice-1 y MAI-1-preview
Resumen de la noticia por IA
Microsoft presenta sus primeros modelos de IA generativa: MAI-Voice-1 y MAI-1-preview

Microsoft presenta sus primeros modelos de IA generativa: MAI-Voice-1 y MAI-1-preview

Resumen generado por Inteligencia Artificial
La IA puede cometer errores u omisiones. Recomendamos leer la información completa. ¿Encontraste un error? Repórtalo aquí
×
estrella

Accede a esta función exclusiva

ha presentado sus dos primeros modelos de (IA), MAI-Voice-1 y MAI-1-preview, y ha explicado que pretende “orquestar” una gama de modelos especializados que satisfagan diferentes casos de uso de los usuarios para generar un valor “inmenso”.

El gigante tecnológico considera que la IA será “la puerta de entrada a un universo de conocimiento”, y ha asegurado que está centrado en crear IA aplicada como plataforma para productos que definan categorías y sean “de gran confianza”, así como sean capaces de comprender las “necesidades únicas de cada usuario”.

Newsletter El Comercio MedIA

Alicia Rojas
MIRA: Día del Gamer: Perú es el país con mayor concentración del segmento ‘Gaming’ en Latinoamérica

De esta manera, Microsoft ha lanzado su primer modelo de inteligencia artificial de voz, MAI-Voice-1, que genera un audio “expresivo de alta fidelidad en escenarios con uno o varios altavoces” en menos de un segundo y con una duración de un minuto completo, según ha especificado la compañía en una publicación en su página web.

La compañía ha señalado que esta capacidad generativa utiliza una sola GPU, lo lo convierte en uno de los sistemas de voz “más eficientes” disponibles en la actualidad.

Primeros modelos de lenguaje de Microsoft.
Primeros modelos de lenguaje de Microsoft.
/ MICROSOFT.

Este modelo está disponible en Copilot Daily y Podcasts, así como también se está lanzando en Copilot Labs, según ha apuntado Microsoft, donde se pueden probar demostraciones de habla expresiva y narración.

MIRA: Gemini mejora la edición de imágenes con Gemini 2.5 Flash Image, el modelo ‘nanobanana’: combina varias imágenes de forma coherente

En segundo lugar, la empresa de Redmond ha informado de que ha comenzado las pruebas públicas de MAI-1-previev en la plataforma de evaluación LMArena. Se trata de un modelo interno de expertos que ha sido preentrenado y postentrenado con aproximadamente unas 15.000 GPU Nvidia H100, por lo que está diseñado para ofrecer “potentes capacidades” a los usuarios que buscan modelos especializados en “seguir instrucciones y proporcionar respuestas útiles a consultas cotidianas”.

Asimismo, la compañía tecnológica ha indicado que en las próximas semanas implementará la versión preliminar de este modelo para ciertos casos de uso de texto en Copilot para seguir ajustándolo con los comentarios de los usuarios. La empresa liderada por Satya Nadella también ha puesto este modelo a disposición de probadores de confianza.

De esta manera, Microsoft ha apuntado que pretende “orquestar una gama de modelos especializados que satisfagan diferentes intenciones y casos de uso”, con el fin de generar un “valor inmenso” para los usuarios.

Mira también:

Contenido sugerido

Contenido GEC