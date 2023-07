Sin embargo, en los últimos meses, hemos presenciado una avalancha de anuncios relacionados con esta tecnología. Cada día surge un nuevo titular destacando un logro en IA, algunos incluso adoptan un tono alarmista. Todo parece indicar que la inteligencia artificial ha tomado impulso, pero ¿qué ha causado que en menos de un año acapare tanta atención, relegando a otras innovaciones prometedoras como el metaverso? ¿Y cómo está respondiendo a este movimiento la industria tecnológica?

Modelos neuronales y revolución GPT

Una foto tomada el 31 de marzo de 2023 en Manta, cerca de Turín, muestra una pantalla de computadora con la página de inicio del sitio web de inteligencia artificial OpenAI, mostrando su robot chatGPT. (Foto de Marco BERTORELLO / AFP) / MARCO BERTORELLO

La revolución de la inteligencia artificial se ha visto impulsada en gran medida por los modelos de redes neuronales, sistemas que imitan la forma en que el cerebro humano procesa información. Estos modelos son entrenados para reconocer patrones y hacer predicciones precisas.

Una amplia variedad de software y aplicaciones utilizan estos modelos neuronales para diversas tareas. Por ejemplo, encontramos sistemas de reconocimiento de voz en los altavoces inteligentes de Amazon, Google y Apple. También están los chatbots utilizados por empresas en sus canales de atención al cliente, así como los conocidos asistentes de voz en los dispositivos Android (Google) e iOS (iPhone).

Aunque estas herramientas, capaces de comprender el lenguaje humano y ofrecer respuestas sin intervención humana, se utilizan desde hace tiempo, una en particular ha sido completamente disruptiva: ChatGPT.

Desarrollado por OpenAI y lanzado al público el 30 de noviembre de 2022, ChatGPT es un sistema de inteligencia artificial diseñado específicamente para mantener conversaciones con personas. Mediante el uso de técnicas de aprendizaje supervisado y de refuerzo, ha sido ajustado para comprender y analizar las palabras escritas, capturando su secuencia, significado e interpretando la intención detrás de ellas. Gracias a este proceso, genera respuestas basadas en la información con la que ha sido entrenado.

“Antes los chatbots daban respuestas que estructuralmente estaba bien hechas, pero que semánticamente se quedaban cortas, incluso a veces eran un poco incoherentes. En cambio, ChatGPT – aparte de que estructura bien sus oraciones y están bien formadas semánticamente– puede seguir una conversación gracias a que tiene una ventana de memoria donde se quedan registradas las conversaciones. Es lo más parecido a un lenguaje natural”, señala César Beltrán, coordinador del Grupo de Investigación en Inteligencia Artificial de la Pontificia Universidad Católica del Perú (PUCP).

El funcionamiento de este sistema de inteligencia artificial se basa en GPT, que podríamos considerar como el cerebro detrás de la maquinaria. GPT es un modelo de lenguaje en constante evolución y mejora. La primera versión disponible de forma gratuita al público fue GPT-3.5, pero OpenAI ya ha lanzado la versión de pago, GPT-4.

“GPT prácticamente se ha adelantado a los años. Los que trabajamos en inteligencia artificial francamente esperábamos algo como esto, pero de acá unos cuatro o cinco años”, comenta Beltrán.

La utilidad de esta IA es amplia y muchas personas ya la integran en su rutina diaria. Por ejemplo, se puede solicitar a ChatGPT que genere un plan de dieta y ejercicio personalizado, teniendo en cuenta características individuales como peso, altura, condición médica e intolerancias alimentarias. También puede ofrecer ayuda en programación, generando código HTML desde cero, ya que cuenta con conocimientos en diversos lenguajes de programación. Además de estas tareas, ChatGPT puede desempeñar roles como traductor, asesor financiero, profesor de idiomas, guionista, cuentista, compositor de poemas y canciones, entre otros. En resumen, su capacidad para desempeñar una amplia variedad de funciones es considerable.

Las redes neuronales son sistemas simplificados que emulan la forma en la que el cerebro humano.

No obstante, no todo es perfecto. ChatGPT tiene dos puntos débiles notorios. Por un lado, la información que utiliza está actualizada solo hasta setiembre de 2021. Por otra parte, en ocasiones puede generar respuestas con datos inventados, lo que significa que no se puede considerar confiable al 100%.

Pese a esto, lo que estamos viviendo es solo el principio de algo más grande. De acuerdo con Omar Florez, investigador peruano especialista en IA con diez años en Silicon Valley, el auge de esta tecnología se da porque estamos en medio de una tormenta perfecta.

“Hemos creado una gran cantidad de información en Internet, que además ha sido digitalizada y almacenada en bases de datos. Además, hemos descubierto una verdad muy interesante: mientras más grandes son las redes neuronales artificiales, estas pueden exhibir capacidades más inteligentes. La comunidad científica de IA ha estimado que un modelo con más de cien mil millones de parámetros entrenables exhibe capacidades emergentes como el razonamiento y un gran entendimiento del lenguaje humano. En resumen, nunca antes tuvimos modelos tan grandes como ahora, con las proezas de ingeniería y ciencia computacional que esto requiere, ni tanta cantidad de información para alimentar estos algoritmos”, dice el especialista.

IA generativa de imágenes

Además de ChatGPT, otros sistemas de inteligencia artificial han ganado gran popularidad, especialmente aquellos que pueden generar imágenes a partir de texto. Estos sistemas tienen la capacidad de comprender el lenguaje natural y han sido entrenados para reconocer las formas en que las personas se expresan y hacen solicitudes. Simplemente con describir lo que se desea, la IA puede crear una imagen en cuestión de segundos.

Estos programas han sido desarrollados utilizando bancos de imágenes, obras de arte y fotografías, lo que permite que la IA pueda reconocer fácilmente si se le pide retratar personajes o situaciones conocidas. También tienen la capacidad de combinar conceptos, estilos y atributos para generar una imagen. Por ejemplo, se podría pedir que cree una imagen bajo la premisa: “El Inca Atahualpa se prepara para la guerra”, y se pueden realizar ajustes solicitando un estilo ultrarrealista, impresionista o de anime japonés, entre otros.

"Inca Atahualpa prepares for war photorealistic" fue la frase que se le pidió generar en imágenes a Midjourney. | (Foto: Midjourney)

Entre los modelos más reconocidos se encuentran Midjourney, Fireflay, Stable Difussion, DALL-E 2 (también desarrollado por OpenAI) y Image Creator de Microsoft, impulsado con DALL-E.

Google en “código rojo”

La llegada de ChatGPT no fue bien recibida por el gigante de Internet. Varios expertos señalaron que el modelo de búsqueda de Google podría enfrentar desafíos, ya que ChatGPT proporciona respuestas más precisas y accesibles en comparación con la búsqueda de información en la web. La alianza entre Microsoft y OpenAI fue considerada una sorpresa desagradable, ya que la compañía de Bill Gates integró la tecnología de GPT-4 en su buscador Bing, que incluso se mejoró con DALL-E 2.

Según informó el New York Times, Sundar Pichai, CEO de Google, declaró un “código rojo” interno para reestructurar equipos y tomar a ChatGPT como una amenaza seria para su negocio. Como resultado de esta contraofensiva, Google lanzó Bard, su propio motor conversacional basado en el modelo de lenguaje LaMDA, el cual fue creado dos años antes.

La gran diferencia entre Bard y su rival es que el primero utiliza información de Internet para ofrecer respuestas actualizadas, mientras que ChatGPT está entrenado con información extraída de la red hasta 2021 y no tiene conocimiento de eventos recientes. Sin embargo, por el momento, Bard no está disponible en español.

Con esto, Google busca adentrarse de lleno en el campo de la IA. Durante su evento para desarrolladores en mayo, la empresa Google revela su estrategia de inteligencia artificial para competir con ChatGPT, como Google Maps, Gmail, Calendar, entre otras.

Bard es la inteligencia artificial generativa de Google. / Google

¿Metaverso relegado?

Facebook lideró durante mucho tiempo la carrera por la innovación tecnológica. Sin embargo, en octubre de 2021, la compañía fundada por Mark Zuckerberg cambió su nombre a Meta, lo cual no fue solo un simple rediseño, sino que también marcó su apuesta por el metaverso.

El metaverso, que consiste en mundos de realidad virtual, se presentó como la tecnología del futuro. Aunque generó un gran interés inicial, rápidamente quedó en segundo plano cuando las inteligencias artificiales generativas, como ChatGPT, entraron en escena. La realidad virtual (RV) aún enfrenta desafíos significativos, ya que es una tecnología costosa que requiere una infraestructura compleja, mientras que el gran potencial de la inteligencia artificial radica en su capacidad para optimizar procesos. Aunque es poco probable que el metaverso sea olvidado, su adopción será gradual, como lo demuestra el reciente lanzamiento de los lentes de realidad virtual de Apple.

Es importante destacar que Meta ha estado utilizando inteligencia artificial en los sistemas de recomendación y clasificación de servicios como Facebook e Instagram desde hace mucho tiempo. Además, ha desarrollado su propio modelo de lenguaje a gran escala llamado LLaMa. Aunque Zuckerberg admitió haber llegado tarde a la carrera por la IA, la compañía está tomando las medidas necesarias para intentar liderar el sector.

Un ejemplo de esto es la reciente presentación de MusicGen, un modelo de IA de fácil uso que puede generar música de alta calidad a partir de una breve descripción en texto y una melodía. También está I-JEPA, que recopila datos del mundo exterior, crea un modelo interno de este y compara representaciones abstractas de imágenes en lugar de comparar los propios píxeles, como lo hacen otras herramientas similares.

Meta considera que el metaverso será una realidad en 10 a 15 años. / Meta

El camino a seguir

No es fácil predecir qué pasará con la inteligencia artificial. De aquí a diez años muchas cosas pueden suceder, pero a mediano plazo Omar Florez considera que se avanzará en la comunicación hombre-máquina.

“En cinco años podemos esperar los asistentes más inteligentes que alguna vez pudimos imaginar. Piense en tener un ChatGPT dentro de cada dispositivo de la casa y que usted pueda no solo conversar con su horno microondas, sino también darle una orden que requiera la cooperación de varios dispositivos. Si los algoritmos de IA pueden entender el lenguaje tan bien como un ser humano, es natural que empecemos a ver comunicación y cooperación entre ellos mismos”, dice.

César Beltrán, por su lado, cree que es posible que veamos dos tendencias claras: la multimodalidad y la interacción de la IA con servicios.

“Lo primero que veremos es la multimodalidad, que ya está en prototipo, tanto Meta y OpenAI trabajan en ella. ¿A qué me refiero? A que no solo vamos a trabajar con texto, sino también con imágenes y audio. Así, gracias a la IA se podrán crear, por ejemplo, videos de forma completa, con guion, imágenes, audio y hasta con la música de fondo y los sonidos”, comenta el especialista a este Diario.

“Lo otro que va a venir es la interacción de estos modelos, pero con servicios. Actualmente, se le puede pedir a la IA que haga un itinerario de viaje por cierta cantidad de días. Pero en un futuro no muy lejano se le podrá pedir que compre los pasajes, reserve el hotel o separe la cena en algún restaurante que haya recomendado previamente. Es más, se podrá hacer esas peticiones en base a un presupuesto determinado”, añade.