Los chatbots parecen razonar, pero no es más que una ilusión: fallan en situaciones clave

Aunque los chatbots parecen razonar, un estudio sugiere que su capacidad se desmorona ante cambios mínimos, poniendo en duda la fiabilidad de estos modelos de inteligencia artificial

Bill Gates revela cuáles son sus tres principales preocupaciones frente a la inteligencia artificial
Geoffrey Hinton, el ganador del Nobel de Física que renunció a Google y denunció los peligros de la inteligencia artificial para la humanidad

Seguir en

Imagen creada con inteligencia artificial

Por Redacción EC14/10/2024, 09:43 a.m.

Un equipo de investigadores de Apple ha puesto a prueba las capacidades de razonamiento de varios modelos de inteligencia artificial, revelando que su desempeño es más frágil de lo que aparenta. En el análisis, se midieron sistemas de IA como GPT-4o, Llama y Mistral, comparando su capacidad para resolver problemas matemáticos y lógicos.

A pesar de que muchos chatbots simulan comprender y razonar de manera convincente, el estudio demostró que estos sistemas se ven afectados por alteraciones simples, como cambios en nombres o cifras en los enunciados. El equipo empleó una herramienta llamada GSM-Symbolic para evaluar cómo respondían los modelos ante problemas con valores modificados.

MIRA: Investigadores desarrollan una técnica que reduce el consumo de energía en IA en un 95%

Los resultados muestran que la precisión de los modelos varía significativamente, y su rendimiento disminuye si se altera ligeramente el contexto de los problemas. Por ejemplo, al cambiar nombres o incluir datos irrelevantes, los modelos fallan en reconocer que esa información no afecta la solución del problema. Mehrdad Farajtabar, uno de los investigadores, explica que la IA suele dar peso a datos innecesarios, un comportamiento que evidencia la falta de verdadero razonamiento.

Añadir o quitar información afecta demasiado a la capacidad de "razonamiento" de los LLM, concluyeron estos investigadores.

El estudio resalta la fragilidad de estos sistemas en situaciones controladas. Pruebas como las del GSM8K, un benchmark matemático, muestran que los modelos obtienen buenos resultados en entornos ideales, pero su desempeño decae con modificaciones mínimas. Además, los investigadores demostraron que los modelos de IA cometían errores al enfrentarse a tareas sencillas, como jugar al ajedrez, donde ejecutaban movimientos inválidos.

El informe advierte sobre las implicaciones de confiar demasiado en estos sistemas. Si bien son útiles para responder preguntas simples, su aparente capacidad de razonamiento puede resultar engañosa, lo que genera riesgos en tareas más complejas. Los expertos concluyen que la IA necesita mejoras sustanciales antes de ser utilizada en aplicaciones críticas que dependan de su fiabilidad.

TE PUEDE INTERESAR

Seguir temas

El Comercio

Los chatbots parecen razonar, pero no es más que una ilusión: fallan en situaciones clave

Aunque los chatbots parecen razonar, un estudio sugiere que su capacidad se desmorona ante cambios mínimos, poniendo en duda la fiabilidad de estos modelos de inteligencia artificial

IA

inteligencia artificial

OpenAI

Últimas noticias

Temblor en Chile hoy, martes 14 de julio: epicentro y magnitud del último sismo

Temblor en Perú hoy, martes 14 de julio: hora exacta, epicentro y magnitud del último sismo

Resultados Sorteo Mayor 4020: tabla de premios del martes 7 de julio

Sorteo Mayor 4020 del martes 14 de julio: sigue la transmisión de la Lotería Nacional

Lo último en Inteligencia Artificial

Microsoft advierte a las empresas que usan IA: “Al consumir inteligencia, la creas”, pero no te pertenece

Sindicato de actores de EE.UU. exige a Meta permiso para usar imágenes en su IA

Grok 4.5: nuevo modelo de IA tiene mejoras en programación, más velocidad y menor costo

Muse Image: así puedes evitar que usen tus fotos para crear imágenes con la IA de Meta

Más sobre IA

La IA Claude desarrolló por sí solo un “espacio mental” para procesar ideas antes de responder

¿La inteligencia artificial puede gobernar personas?

¿Una IA podría predecir las conductas de los argentinos?

Los anuncios de Google indicarán si han sido creados con inteligencia artificial

Contenido sugerido

Murió Sam Neill: un legado inolvidable en el cine y la televisión

Murió la icónica cantante Bonnie Tyler a los 75 años en Portugal

Nominaciones a los Premios Emmy 2026: lista de categorías

La psicología dice que las personas que miran hacia abajo al caminar no lo hacen por comodidad, sino están “atrapados” en sus propios pensamientos

Los expertos en psicología coinciden: las personas que tratan con amabilidad a otros tienen alta inteligencia emocional y seguridad interna

Los expertos en psicología coinciden: las personas que siempre tienen el auto sucio sufren de estrés acumulado y poca organización