Recientemente, OpenAI, la empresa creadora del chatbot con inteligencia artificial (IA) generativa ChatGPT, anunció una nueva versión de su popular herramienta que ahora será capaz de “ver, oír y hablar”, un avance ya anunciado hace un tiempo por la marca y que finalmente se hace realidad.

La nueva actualización llegará primero a los usuarios premium hacia la quincena de octubre y luego estará disponible para todos en general.

Cabe destacar que hasta el momento, ChatGPT solo funciona por escrito, por lo que este paso tecnológico nos lleva a preguntarnos qué tanto nos ayudará o en su defecto, perjudicarán estas nuevas herramientas. Para resolver varias de estas dudas, conversamos con César Beltran, coordinador del grupo de investigación en Inteligencia Artificial de la Pontificia Universidad Católica del Perú (PUCP).

-El ChatGPT ahora podrá hablar, oír y ver… ¿Cuáles son los pros y contras de este nuevo avance?

Desde hace un buen tiempo se sabía que eso se iba a dar. Es algo que nosotros le llamamos la multimodalidad, es decir, que no solamente reconozca textos, sino que ahora combina el reconocimiento y generación de imágenes. Ya se viene también la generación de videos, hay varios programas que están generando videos aunque todavía son un poco limitados. En cuanto a los pros y contras, la verdad que yo estoy más del lado optimista de la tecnología porque creo que esta nos va a ayudar a poder mejorar más en todo sentido. El problema dependerá en dónde caiga esa tecnología y el uso que tú le puedes dar, ya sea para bien o para mal.

-¿Qué otros progresos le ves a esta herramienta en el corto plazo?

Creo que esto se está acelerando mucho más rápido de lo pensado. Especialmente por la gran disputa y competencia que hay con las grandes empresas como Google, que ha sacado Bard, que está muy potente ahora y creo que Amazon no se va a quedar atrás, va a comenzar a sacar sus propias herramientas. Ya se ha dicho que Alexa va a comenzar a hablar como si fuese una persona, de forma más natural. Entonces, yo creo que sí se vienen cosas interesantes, vamos a tener una interactividad mucho más natural con las computadoras.

-¿Legal o éticamente como queda el mundo con todo esto?

El problema de la ética es de parte de nosotros, es decir, el uso que nosotros le demos. El problema está también en que, a medida que estamos pensando cómo restringir o cómo son los aspectos legales y éticos de todo esto, la tecnología sigue avanzando. Así que creo que tiene que haber como un encuentro entre países, algo así como se ha hecho con la tecnología nuclear porque de todas maneras tiene que haber restricciones y regulaciones de la inteligencia artificial, eso está claro que tiene que existir. Sin embargo, la tecnología es tan rápida en comparación con los acuerdos que se puedan dar.

-¿Qué nos queda por hacer entonces?

Creo que lo que queda es prepararnos más como sociedad para todo esto. El problema es que nosotros como país tercermundista no tenemos la preparación como para poder enfrentar estos cambios. Lamentablemente nuestros gobiernos están totalmente ajenos e ignorantes de todo esto y no tienen ninguna política ni saben cómo hacerlo porque a nivel de gobierno hay un desconocimiento total de estas cosas. A las personas solo nos queda adaptarnos y a los que conocemos del tema, prepararnos más para poder dominar más esta tecnología y volcarla para resolver los problemas que tenemos como sociedad. El detalle es que los especialistas en el tema somos tan pocos en el Perú que no somos nada prácticamente y a nivel de universidades tampoco hay especialistas preparándose, no hay carreras especializadas para preparar gente en estos temas a nivel científico, a nivel de conocimiento. Lamentablemente no tenemos carreras de ciencia de la computación, que es la carrera que debería preparar a estas personas.

-¿Tecnológicamente, cómo nos ves dentro de 5 años?

Yo creo que al ritmo que vamos, tendremos tecnologías mucho más interesantes. Creo que muchas de las cosas que estamos viendo las vamos a hacer con mayor rapidez. El nivel de interactividad con las computadoras y con estos modelos va a ser cada vez mucho más natural, la generación de imágenes de vídeos va a ser mucho más rápido y mucho más profesional también. Sobre si esto dejará sin trabajo a muchas personas, pues sí, lamentablemente eso va a ocurrir, sobre todo en los trabajos operativos, como el de las teleoperadoras, por ejemplo, va a ser muy natural que quien nos responda sea un chatbot que hable de forma tan natural que nosotros ya no lo distingamos. Yo creo que hasta la misma educación va a cambiar también porque vamos a tener profesores virtuales que prácticamente nos van a ayudar a poder entender temas que tal vez con un profesor de la clase no lo no lo entendamos.

-¿Qué opinión te merece la llamada pornografía sintética, recientemente se publicaron unas fotos con el rostro de una menores de edad? ¿Cuál es la regulación en este caso?

Lo de la pornografía sintética se hacía desde hace un buen tiempo. Con programas de procesamiento de imágenes, uno podía sustituir un rostro, pero esto tomaba mucho tiempo porque lo hacía un especialista. Hoy, en cambio, con las herramientas de inteligencia artificial no necesitamos de especialistas en manejo de herramientas gráficas. Y ya no estamos hablando de solo imágenes sino de poder generar videos inclusive. Además, se ha reducido el tiempo y la facilidad de uso. Una vez más, no es culpa de la herramienta., vuelvo a repetir, el problema está de quién lo usa y para qué lo usan.

DATO OpenAI, además, anunció que Spotify está utilizando el “poder de esta tecnología para traducir algunos de sus pódcast a “idiomas adicionales, pero manteniendo las propias voces de los presentadores e invitados”.