Microsoft continúa apostando por la inteligencia artificial. Esta vez el gigante tecnológico ha lanzado Kosmos-1, un nuevo modelo de IA que puede analizar imágenes y responder una prueba de IQ.
MIRA: Los increíbles rostros de los personajes de GTA San Andreas en la vida real, según una IA
De acuerdo con ArsTechnica, Microsoft publicó el primer documento de esta tecnología en arXiv, el servicio de la Universidad Cornell. El estudio, llamado ‘El lenguaje no es todo lo que necesita: alinear la percepción con los modelos de idiomas’ revela los resultados de un nuevo modelo de lenguaje extenso multimodal (MLLM).
Kosmos-1 se entrenó usando extractos de The Pile, conjunto de datos de código abierto de 825 GB destinados a modelos extensos. El repositorio de datos web Common Crawl también fue un actor en la fase de entrenamiento. En este sentido, la IA considera modos de entrada como texto, imágenes, audio y video.
MIRA: Youtubers construyeron la laptop más grande del mundo: tiene una pantalla de 43 pulgadas | VIDEO
Durante las pruebas, la IA pudo responder preguntas sobre determinadas imágenes: el tipo de peinado de una deportista, por qué era graciosa una foto o la razón por la que lloraba un niño.
Asimismo, fue capaz de realizar operaciones matemáticas simples y reconocer textos y números, como la fecha de estreno en el póster de una película.
MIRA: Bold Glamour, el filtro de belleza con inteligencia artificial que causa temor en TikTok por cambiar totalmente el rostro de las personas
Su desempeño en el test de las matrices progresivas de Raven es, probablemente, lo más interesante de la fase de prueba. Esta consiste en analizar y completar una secuencia de formas y se utiliza para medir la inteligencia humana y el razonamiento abstracto.
MIRA: Lo salvó su iPhone: hombre casi muere tras accidente vehicular pero su celular llamó automáticamente a las autoridades
“En el test de Raven, Kosmos-1 respondió correctamente una pregunta el 22% de las veces, superando la probabilidad aleatoria que es del 17%”, de acuerdo con el portal Hipertextual.
Los resultados revelaron que esta IA puede percibir patrones abstractos en un contexto no verbal. “Si bien la evaluación todavía está muy lejos de lo que puede obtener un adulto promedio, Kosmos-1 demuestra que los lenguajes multimodales son la clave para el desarrollo de una inteligencia artificial que supere a los humanos”, agrega el medio.
Contenido sugerido
Contenido GEC