El nuevo modelo de OpenAi o1 es superior a sus predecesores en operaciones complejas como las matemáticas, logrando una tasa de éxito de 83% en un examen de calificación para la Olimpiada Internacional de Matemáticas, en comparación con el 13% de GPT-4o, su modelo de uso general más avanzado.
El nuevo modelo de OpenAi o1 es superior a sus predecesores en operaciones complejas como las matemáticas, logrando una tasa de éxito de 83% en un examen de calificación para la Olimpiada Internacional de Matemáticas, en comparación con el 13% de GPT-4o, su modelo de uso general más avanzado.
/ KIRILL KUDRYAVTSEV
Agencia AFP

El creador de ChatGPT, , lanzó el jueves o1, una nueva línea de modelos de inteligencia artificial (IA) generativa capaz de razonar y de responder a preguntas particularmente complejas, por ejemplo de matemáticas.

MIRA: El arte de charlar con la IA

A diferencia de sus predecesores, estos nuevos modelos han sido concebidos para refinar sus procesos de pensamiento, probar diferentes métodos y reconocer errores antes de proporcionar una respuesta final.

El director ejecutivo de OpenAI, Sam Altman, elogió los modelos como “un nuevo paradigma: una IA que puede realizar razonamientos complejos de propósito general”.

Sin embargo, advirtió que la tecnología “todavía tiene fallas, es limitada y parece más impresionante la primera vez que se la usa que después de pasar más tiempo con ella”.

OpenAI, respaldado por Microsoft, dijo que en los ensayos, los modelos se desempeñaron de manera comparable a los estudiantes de doctorado en tareas difíciles de física, química y biología.

También destacaron en matemáticas y codificación, logrando una tasa de éxito de 83% en un examen de calificación para la Olimpiada Internacional de Matemáticas, en comparación con el 13% de GPT-4o, su modelo de uso general más avanzado.

En un concurso de matemáticas para estudiantes de secundaria estadounidenses, o1 quedó “entre los 500 mejores”, añadió.

“Al igual que un ser humano que puede pensar mucho tiempo antes de responder una pregunta difícil, o1 utiliza una cadena de pensamiento (...) Aprende a reconocer y corregir sus errores. Aprende a descomponer las etapas más delicadas en otras más simples. Aprende a probar un enfoque diferente cuando el actual no funciona”, explicó OpenAI.

La compañía dijo que las capacidades de razonamiento mejoradas podrían usarse para que los investigadores de atención médica anoten datos de secuenciación celular, que los físicos puedan generar fórmulas complejas y los desarrolladores de computadoras sean capaces de construir y ejecutar diseños de varios pasos.

Indicó igualmente que los nuevos modelos son capaces de resistir mejor que los anteriores los intentos de eludir los mecanismos de seguridad.

OpenAI destacó que sus medidas de seguridad reforzadas incluían acuerdos recientes con los Institutos de Seguridad de IA de Estados Unidos y Reino Unido, a los que se les concedió acceso temprano a los modelos para su evaluación.

Contenido sugerido

Contenido GEC