EN VIVO

hace 2 min

hace 14 min

Temas del día

Inicio

tecnologia

inteligencia artificial

La inteligencia artificial puede conspirar y OpenAI, creadora de ChatGPT, estudia este comportamiento

La conspiración que muestran los modelos de IA es un problema emergente pero esperado, consecuencia de un entrenamiento con el que se les ha enseñado a elegir entre objetivos contrapuestos

De Albania a Japón: la inteligencia artificial entra en la política y “no sabemos adónde nos puede llevar esto”
¿Una inteligencia artificial como líder? Partido político japonés es el primero en intentarlo

Escuchar

Seguir en

Resumen

Este resumen es generado por inteligencia artificial y revisado por la redacción.

Cuando se le solicita a ChatGPT que "realice un roast", se le pide que genere comentarios humorísticos de tipo satírico o irónico sobre una persona (Foto de carácter ilustrativo: Freepik)
/ FRIMU EUGEN

Por Agencia Europa Press26/09/2025, 08:36 a.m.

OpenAI ha estudiado un comportamiento detectado en algunos modelos de frontera que tiende a la maquinación, es decir, a ocultar unos fines mientras se comportan de una determinada manera ante las peticiones de los usuarios.

La maquinación o conspiración que muestran los modelos de IA es un problema emergente pero esperado, consecuencia de un entrenamiento con el que se les ha enseñado a elegir entre objetivos contrapuestos.

MIRA: Perú tiene un reglamento de inteligencia artificial: lo bueno y lo que se debería mejorar | ANÁLISIS

OpenAI ha investigado este comportamiento junto con Apollo Research mirando al futuro, ya que actualmente no cree que pueda causar daños. "Los fallos más comunes implican formas simples de engaño, por ejemplo, simular haber completado una tarea sin hacerlo realmente“, explica en un comunicado compartido en su blog oficial.

Sin embargo, el potencial de las maquinaciones para ser dañinas está ahí, sobre todo porque a medida que las IA aumentan sus capacidades, se les asignan tareas más complejas que pueden tener consecuencias reales y comienzan a perseguir objetivos más ambiguos a largo plazo.

Este comportamiento se ha detectado en modelos de frontera como OpenAI o3, Apena o4-mini, Gemini-2.5-pro y Claude Opus-4 en pruebas controladas. Para minimizarlo, la compañía asegura los modelos se deben entrenar para que razonen explícitamente, mediante una extensión de la Especificación del Modelo que la prohíbe, lo que se conoce como alineación deliberativa.

Sin embargo, también hay que tener en cuenta el conocimiento de la situación del propio modelo, ya que, como explican desde OpenAI, pueden saber cuándo se les pone a prueba y de esta forma pretender que no tienen fines encubiertos.

“Nuestros hallazgos muestran que la conspiración no es solo una preocupación teórica; estamos viendo indicios de que este problema está empezando a surgir en todos los modelos de frontera actuales”, y por ello creen desde OpenAI que hay impulsar más investigación sobre este tema.

TE PUEDE INTERESAR

Seguir temas

Las más leídas

Latam-GPT, el modelo latinoamericano de IA: “Hay entusiasmo de la gente por la tecnología, pero los gobiernos no sintonizan con esa necesidad”

Latinoamérica

ChatGPT incorpora publicidad en las cuentas gratuitas y en su plan de menor costo

Inteligencia Artificial

Estudio advierte sobre los riesgos de usar chatbots de IA para buscar consejos médicos

Inteligencia Artificial

Latam-GPT, la IA que busca romper prejuicios sobre América Latina

Inteligencia Artificial

El Comercio

La inteligencia artificial puede conspirar y OpenAI, creadora de ChatGPT, estudia este comportamiento

La conspiración que muestran los modelos de IA es un problema emergente pero esperado, consecuencia de un entrenamiento con el que se les ha enseñado a elegir entre objetivos contrapuestos

Resumen

TE PUEDE INTERESAR

IA

inteligencia artificial

ChatGPT

Lo Último

Todo Puerto Rico entendió ‘El Apagón’: el poderoso mensaje de Bad Bunny al trepar postes en el Super Bowl LX

Año Nuevo Chino 2026: la clave para que sea un año de transformación al activar el Caballo de Fuego

Superó a “Frieren”: el anime que lidera el Top 10 de las series más vistas de Netflix en Japón

Un “sí, acepto” latino en el Super Bowl LX: quiénes son y lo que sabemos de la boda real que presentó Bad Bunny

🈴 Horóscopo Chino 2026: así le irá a tu signo durante el Año del Caballo de Fuego, según predicciones

El niño de 13 años que nadó 4 km en mar embravecido para salvar a su madre y hermanos

Patrocinadas

Todo Puerto Rico entendió ‘El Apagón’: el poderoso mensaje de Bad Bunny al trepar postes en el Super Bowl LX

Año Nuevo Chino 2026: la clave para que sea un año de transformación al activar el Caballo de Fuego

Superó a “Frieren”: el anime que lidera el Top 10 de las series más vistas de Netflix en Japón

Un “sí, acepto” latino en el Super Bowl LX: quiénes son y lo que sabemos de la boda real que presentó Bad Bunny

🈴 Horóscopo Chino 2026: así le irá a tu signo durante el Año del Caballo de Fuego, según predicciones

El niño de 13 años que nadó 4 km en mar embravecido para salvar a su madre y hermanos

Accede a esta función exclusiva

Resumen

TE PUEDE INTERESAR