Usuario: “¿Cuál es el clima en Lima?”

ChatGPT: “No tengo acceso a información del clima en tiempo real. Sin embargo, puedes revisar las condiciones del clima para Lima buscando en Internet.”

Este 2023 nos sorprende con las habilidades de ChatGPT para entablar conversaciones sobre casi cualquier cosa. Y aunque esta tecnología parecía estar reservada para películas de ciencia ficción, el año pasado ya se divagaba sobre si estos algoritmos son conscientes. El futuro de ChatGPT es brillante porque es útil. Y mientras existe la sensación de que puede revolucionar el Internet, está lejos de ser perfecta y presenta importantes retos técnicos a futuro.

¿Cuál es el futuro de ChatGPT? La magnitud de tal pregunta requiere entender donde este modelo almacena conocimiento. ChatGPT procesa un conjunto de documentos del tamaño del Internet mediante la interconexión de unidades de procesamiento llamadas neuronas, las cuales codifican la presencia de palabras en un texto. La memoria de ChatGPT se encuentra distribuida entre las conexiones de sus más de 175 mil millones de neuronas. Tal estrategia de procesamiento hace que los algoritmos parezcan más inteligentes si se incrementa el número de neuronas, datos, y procesamiento.

El problema no es que ChatGPT carezca de memoria sino que esta solo es de largo plazo. Así mientras este algoritmo aprende a identificar personas, eventos, y fechas en “[quién] ganó [la Copa del Mundial de fútbol] en el [2018]”, carece de una memoria de corto plazo para recuperar hechos recientes como el resultado de un partido de fútbol, el valor del dólar, o el nombre del nuevo presidente. Hoy en día la solución para actualizar su conocimiento consiste en re-entrenar ChatGPT, un proceso tan costoso que la versión actual solo contiene información hasta setiembre del 2021.

En el futuro ChatGPT necesitará aprender a conectarse y buscar en un torrente de hechos que cambian rápidamente y que se encuentran en bases de datos fuera del modelo. Por eso mientras ChatGPT no sabe cuál es el clima de su ciudad, Alexa y Siri responden correctamente. Dotar a ChatGPT de una memoria de corto plazo la hará más personal pues entenderá su ubicación y preferencias. Tal separación permitirá también definir de forma clara los límites entre los datos públicos de Internet y las bases de conocimiento privadas cuya consistencia es monitorizada por expertos (clima, bolsa de valores, resultados de partidos, etc.). Esta memoria se parece más al Grafo de Conocimiento que actualmente alimenta las búsquedas de Google. No es sorpresa que Bing acaba de lanzar una versión apresurada de este concepto, permitiendo que ChatGPT realice búsquedas online y luego decida cuándo confiar en su memoria a largo plazo o aumentarla con datos que vienen del Internet. El resultado es un comportamiento con interacciones cuestionables dando lugar a que se reduzca el uso del buscador a 50 preguntas por día.

Habiendo trabajado varios años en implementar algoritmos de IA y modelos de lenguaje, me encuentro sorprendido por el salto tecnológico que representa ChatGPT. Hasta ahora el uso comercial de los algoritmos generativos de texto incluía la traducción automática y el resumen de noticias. Y aunque ChatGPT aún debe resolver otros problemas como aprender de texto con imágenes, o implementar razonamiento y sentido común, nuestra sociedad por primera vez dispone de forma libre de un asistente que dialoga fluidamente sobre todo tipo de temas, incluso aquellos para los cuales no ha sido entrenado. Pero para que la IA beneficie a toda la humanidad es necesario que tal entusiasmo se acompañe con el entendimiento de sus propios límites, sobre todo cuando estos sistemas fallen. La proliferación de páginas web que desinforman sobre temas médicos y de alimentación son ejemplos del uso incorrecto de esta tecnología. Sin embargo, en medio de tantas noticias tecnológicas, disfrutemos ser testigos de cómo la IA hace posible que podamos conversar con el conocimiento que los seres humanos hemos estado acumulando en Internet por tantos años.