

A inicios de año, en pleno fervor por la inteligencia artificial, las predicciones avizoraban que el 2025 sería el año de los agentes IA, sistemas capaces de planificar, ejecutar y entregar proyectos completos sin intervención humana. Microsoft hablaba de “trabajadores IA” y los expertos auguraban una revolución laboral. Pero un nuevo estudio de Scale AI ha puesto un baño de realidad: los agentes aún están lejos de sustituir personas.
El análisis comparó el desempeño de varios modelos en proyectos reales de tipo freelance, evaluados por un panel de 40 jueces que actuaron como clientes humanos. Las pruebas abarcaron desde diseño de producto y desarrollo de videojuegos hasta análisis de datos y redacción científica. En palabras del cofundador de OpenAI, Andrej Karpathy, los agentes, simplemente, “todavía no están ahí”.
MIRA: Google planea reactivar una planta nuclear cerrada en el 2020 para impulsar su inteligencia artificial
El modelo Manus fue el mejor posicionado, aunque apenas logró que el 2,5% de sus entregas fueran consideradas aceptables. A partir de ahí, el rendimiento cayó: Grok obtuvo un 2,1%, Claude un 1,8%, GPT-5 un 1,7%, y Gemini 2.5 Pro cerró la lista con 0,8%. En resumen, menos de tres de cada cien proyectos presentados habrían superado el filtro de un cliente real.
Aun así, los investigadores destacan que el resultado no es del todo negativo. Alcanzar ese nivel de desempeño en tareas humanas ya representa un avance significativo si se considera el punto de partida de la IA generativa hace apenas unos años. El problema, subrayan, no es la falta de potencia, sino la ausencia de criterio, contexto y comprensión de matices.
“Los modelos son rápidos y coherentes, pero no piensan como las personas”, concluye el informe. El año de los agentes autónomos no ha llegado, aunque los avances actuales podrían ser la antesala de una nueva generación más capaz de razonar, priorizar y decidir por sí misma.
TE PUEDE INTERESAR
- Desconectarse genera ansiedad en peruanos: más del 50% de los consumidores se ven afectados
- Elon Musk pide pago de un billón de dólares para mantener control del ejército de robots que Tesla construye
- NEO, el robot doméstico que es casi un humano y ya puedes separar con 20 mil dólares| VIDEO
- La ‘tecnofobia’ y porqué el papa León XIV pide a las escuelas católicas que la eviten
Contenido sugerido
Contenido GEC


¿Realmente los beneficiarios del Seguro Social recibirán US$200 adicionales en 2026?
MAG.
¿Qué pasará con el objeto interestelar 3I/ATLAS tras su acercamiento a la Tierra? La NASA y ESA ya tienen la respuesta
MAG.
Final explicado de “El cuco de cristal”: qué pasó realmente con Miguel y cuál es el secreto de Rafa
MAG.
▷ ¿Va a nevar en Nueva York por el Thanksgiving Day 2025? Pronóstico del clima para el 27 de noviembre
MAG.




