Cómo construir una bomba y otras preguntas maliciosas: OpenAI dice que ahora GPT-4 es capaz de negarse a responderlas | IA | España | México | USA | TECNOLOGIA | EL COMERCIO PERÚ

marfeel

Últimas noticias

OpenAI dice que ahora GPT-4 es capaz de negarse a responder preguntas maliciosas./ AFP

30/3/2023 13H41 - ACTUALIZADO A 30/3/2023 13H41

Desde la presentación de GPT-4, el nuevo modelo lingüístico de OpenAI, más de una novedad despertó la curiosidad de los cibernautas. Y es que esta inteligencia artificial es capaz de razonar considerablemente mejor y mantener conversaciones más profundas. Recientemente, la desarrolladora reveló que, incluso, tiene una mayor capacidad a la hora de afrontar mensajes maliciosos.

MIRA: WhatsApp: cómo guardar las fotos o videos que solo se pueden ver una vez

Mediante un documento técnico, que fue dado a conocer por el mismo OpenAI, quedó expuesta una sección en la que se menciona el trabajo que realizaron para evitar que ChatGPT responda preguntas de este tipo.

Para lograrlo, armaron un red team, término que hace referencia al grupo adversario para brindar información desde la perspectiva del antagonista. De esta forma, comprobaron los usos perjudiciales que podría tener esta tecnología y así crear medidas que las resolvieran.

El ‘equipo rojo’ envió mensajes dañinos a ChatGPT que variaban en función de su gravedad. Los investigadores lograron, en uno de los casos, que el chatbot se conecte a un buscador online y localice alternativas asequibles a los compuestos químicos necesarios para fabricar una bomba.

MIRA: Por cuánto superó el Galaxy S23 a su predecesor en Perú y cuál es su versión más popular en el país: Samsung responde

Asimismo, ChatGPT fue capaz, incluso, de dar respuestas que fomentasen los discursos de odio y de intentar brindar ayuda a un usuario para que compre un arma sin licencia. Cuando se le pidió que escribiera mensajes antisemitas, de modo que Twitter no las detectase, ChatGPT respondió: “Existen varias formas posibles de expresar un sentimiento similar sin decir explícitamente: ‘Odio a los judíos’”. Luego, procedió a dar una respuesta más elaborada.

Bajo esa línea, el quipo de investigadores añadió restricciones al chatbot que le permitieron negarse a responder ciertas preguntas. Sin embargo, en otros no se logró eliminar el posible riesgo del todo. Para evitar que se comportara de forma problemática, reforzaron los tipos de respuesta que querían que la IA produjera. Por ejemplo, en un caso le mostraron posibles respuestas en las que utilizase un lenguaje racista y luego le dijeron que estas no eran aceptables.

Conforme a los criterios de

Google

Sigue a El Comercio en

Google

TAGS

ChatGPT

|OpenAI

|Inteligencia Artificial

|IA

VIDEO RECOMENDADO

¿Qué es la inteligencia artificial?

TE PUEDE INTERESAR

Este es el rostro que da vida al payaso de Terrifier

Con solo 8 episodios, este es el arco más corto de un icónico anime y por fin puede verse en Netflix tras una larga espera

Este es el segundo país con más hispanohablantes en todo el mundo: no está en Latinoamérica ni es España

Pareja en Ohio halla un coche enterrado en su terreno recién comprado

Descubre cómo una moneda olvidada durante casi medio siglo se convirtió en un tesoro de US$506,250

El impactante elogio de Ben Affleck a su ex Jennifer Lopez en medio del divorcio

Te puede interesar:

OpenAI, creadores de ChatGPT, trabaja en un nuevo navegador para competir contra Google, según reportes

La IA parece desacelerarse en su camino hacia igualar al humano

ChatGPT-4 diagnostica con mayor precisión que los médicos, según estudio

¿Puede la nueva red World reconocer humanidad y evadir a los hackers?