El dominical

Jorge Luis Borges y el Big Data: el conocimiento desbordado

A 30 años de la partida de Borges, el saber infinito del que escribió tiene donde archivarse: la materialidad digital.

Jorge Luis Borges y el Big Data: el conocimiento desbordado

El cuarto infinito: instalación de big data en San Francisco, Estados Unidos, que simula un interminable paisaje digital en un área de 15x18 pulgadas. (Fuente: universaleverything.com)

Una interminable biblioteca de galerías hexagonales enlazadas, un libro que no tiene principio ni fin, un laberinto cuyas bifurcaciones no dejan de multiplicarse. El lenguaje borgeano guarda una serie de metáforas que juegan con el conocimiento infinito, con la totalidad de saberes y la apremiante imposibilidad de acceder a todos ellos.

“Un lugar que albergue el conocimiento universal”. Era una obsesión de Borges, pero también es la idea que usa Patricio Lorente para definir Wikipedia, la organización que dirigió hasta julio pasado. El pretencioso enunciado se apoya en las crecientes estadísticas de la enciclopedia virtual: más de 40 millones de artículos y presencia en 292 idiomas.

“Contiene la mayor colección de información ordenada y sistematizada de la historia”, anota tajante. Sus palabras buscan aproximarse a lo que escribió Borges siete décadas atrás. En aquellos textos de los cuarenta del siglo pasado, varios han visto signos predictivos, rasgos que prefiguran la naturaleza de la red. “La primera vez que accedí a Wikipedia se me vino a la mente ‘La biblioteca de Babel’ por su sistema de enlaces. Uno empieza en un lugar y puede terminar en otro muy distinto”, dice Lorente, convencido del poder premonitorio del autor de Ficciones.

En los intersticios de las galerías hexagonales de Borges había la posibilidad de escabullirse y saltar a otras aún no exploradas, como aquellos hipervínculos que nos alejan de la web inicial. El número de conexiones asoma inacabable, no cuantificable. El conocimiento entonces se dispersa, sin orígenes ni finales. “El crecimiento de la información en Internet no tiene límites. Siempre habrá lagunas por completar. Se puede traer también la metáfora de ‘El libro de arena’, un cuerpo infinito donde entre dos páginas aparece siempre otra. Nunca es posible encontrar la página exacta”, resalta Lorente.

* * *

Sin embargo, quien llevó la premonición borgeana a una forma obsesivamente exacta no tiene la prensa de Wikipedia. Jonathan Basile, un filósofo estadounidense de 30 años fanático del autor argentino, dedicó seis meses a diseñar un algoritmo que permite reproducir cualquier texto imaginable en la lengua occidental. Ante la dificultad de ser recreada físicamente, el monstruoso conocimiento anunciado por Borges cobró vida en la materialidad digital. Como en el relato “La biblioteca de Babel”, que describía un lugar donde estuviesen escritas todas las combinaciones del alfabeto, al ingresar al portal www.libraryofbabel.info podremos buscar palabras en un sinfín de páginas que tienen todas las mixturas posibles de 29 signos ortográficos (el abecedario, el punto, la coma y el espacio).

Frases de canciones, novelas, nombres propios y cuentos escritos (o por escribirse) están contenidos en las búsquedas. Y no solo eso. Retribuyendo a la idea de totalidad de la obra borgeana, en la asombrosa biblioteca digital de Basile también están incluidas aquellas agrupaciones de letras que producen formaciones incoherentes, no legibles en ningún lenguaje. “Este proyecto no es algo que produjera valor en un sentido reconocible, como una empresa o una invención. No voy a ganar dinero ni a cambiar mi actividad, pero sí puede afectar el modo en el que pensamos con respecto a la esencia del lenguaje”, refirió modestamente el inventor. Dejaba en claro su única pretensión (y quizá también la que tuviese Borges): repensar y tensionar las formas conocibles del lenguaje.

En la pieza experimental de Basile es el hombre letrado quien tiene el desafío de encontrar cuerpos de letras con sentido en un mar de mensajes encriptados. En la lectura, tradicionalmente vista como algo estático, se busca identificar marcas reconocibles y racionales de una maraña de signos desiguales. Estamos atentos a matrices, repeticiones. Las narrativas lógicas aparecen a partir de cuestiones identificables conectadas entre sí.

Ante el caos, es el lector quien decide qué senderos recorrer. Una vieja máxima borgeana. En tiempos cuando no se rebatía la unidireccionalidad de los mensajes, el autor de “El aleph” ya le atribuía un rol protagónico a la lectura dentro del juego literario.


La Torre de Babel, hecha con 30.000 libros de distintos idiomas, en el 2012 en Buenos Aires.

* * *

Se consideró un lector voraz más que un autor. Incluso ciego, no dejó de leer. A su casa llegaban entusiastas jóvenes y amigos que fungían de interlocutores de las páginas que ya no podía ver. En el prólogo de su temprana Historia universal de la infamia (1935) deja clara su posición: “Estos cuentos son el irresponsable juego de un tímido que no se animó a escribir cuentos y se distrajo en falsear y tergiversar ajenas historias”. Es decir, reescribir sobre historias leídas más que escribir. Para el investigador argentino Lisandro Bregant, en esa tergiversación está la necesidad de organizar lo encontrado. Similar a la actitud que tomamos cada vez que accedemos a Internet. “El espíritu del ordenamiento de la información aparece en la obra borgeana y se hila a partir del lector. Este es quien busca darle un orden a ese desorden universal que es la biblioteca total, el universo, la Internet”, explica.

Quien se enfrenta a este nuevo cúmulo de información adopta, inherentemente, una actitud propositiva. La mentada figura actual del “prosumidor” (un consumidor, en este caso un lector que interfiere en la producción de sentidos y contenidos) de la red reivindica al lector borgeano: un cuerpo vivo capaz de resignificar cada página.

Sumergidos en un contexto de abundancia de estímulos, hoy de ese todo tomamos y decodificamos partes que consideramos convenientes o necesarias. No resulta sencillo ese traspaso conductual. El sistema educativo, una de las primeras áreas puestas en tensión, afronta un cambio de paradigma en su metodología. “Los docentes fueron formados en otro tiempo, cuando cómo encontrar información era una habilidad requerida para desempeñarse con éxito en la sociedad. Hoy eso ha dejado de ser un problema”, anota Lorente.

La aparente accesibilidad al conocimiento posibilitada por diversos dispositivos online (computadores, celulares, tabletas, etc.) parece haber llevado el ejercicio de búsqueda a un automatismo. Encontrar sería un paso previo tácito (ya dado) y el reto se ubicaría en los actos posteriores a nuestros clics de búsquedas. “El desafío es qué hacer con esa enorme cantidad de información, cómo usarla de manera productiva, tener una mirada crítica, extraer contenidos y poder sintetizar”, sentencia el exdirectivo de Wikipedia.

* * *

En “Funes, el memorioso” Borges retrata a un hombre que de manera mecánica podía recordar cada detalle de sus días, pero que carecía de introspección y pensamiento. Su prodigioso y obsesivo memorismo, gracias al cual había acumulado un gran contingente de información, le impedía borrar diferencias, generalizar y reflexionar. “Así como Funes, Wikipedia es una colección admirable de conocimiento, pero boba. Necesita al lector para hacer estas acciones de comprensión. De algún modo, Internet nos libera del ejercicio de memorizar para dedicarnos a construir nuevos conocimientos”, dice Lorente.

¿Pero qué pasa cuando un actor organiza por nosotros los caminos a transitar? Si bien está latente la posibilidad de montar rutas de navegación propias, resulta muy tentador dejarse seducir por las señales iniciales, por lo exhibido en ese primer pantallazo que sugiere el buscador de buscadores, Google. Cada segundo, un promedio de 40.000 personas recurren a su motor de búsqueda para despejar inquietudes. El ordenamiento de Google responde a un criterio sencillo: índice de popularidad. Así, las páginas más citadas y consultadas aparecerán instantáneamente ante nuestros ojos, como los primeros invitados a la fiesta. La lógica de privilegiar los sitios populares esconde un juego sagaz: fomenta un círculo vicioso que se retroalimenta continuamente en cada búsqueda.

Bajo esas reglas, Wikipedia sale bien parada. Actualmente, con 500 millones de visitantes únicos mensuales es uno de los cinco sitios web más consultados del mundo. “Hay un sesgo intrínseco en los sistemas de búsqueda. El algoritmo de Google favoreció a Wikipedia en desmedro de otros”, admite Lorente.

En nombre de la comodidad y practicidad, cada usuario que detiene la resolución de sus dudas en Wikipedia va legitimando el discurso. Nuestros ojos se van acostumbrando a quedarse en la parte superior de esa infinita sábana de datos que es la Internet. Nuestros tiempos exigen salidas rápidas y accesibles, que prescindan de contrastes o comprobaciones. Entonces, las primeras voces van tornándose las oficiales.

La Fundación Wikimedia, institución que administra Wikipedia, busca compensar ese sesgo con una mejor calidad de contenidos. La naturaleza colaborativa en la construcción de los textos intenta elevar los estándares de las publicaciones. Para Lorente, los cuestionamientos respecto al contenido de Wikipedia son una discusión casi superada. “No existe la pretensión ingenua de que exista neutralidad, pero sí diversidad. Los artículos de mayor calidad son los que tienen más puntos de vista y enfrentados entre sí. La colección es producto de ese equilibrio inestable, de producción permanente”, refiere.

La escritura colectiva no solo es aludida como garantía de calidad. También es la base del concepto de hipertextualidad planteado en la obra de Borges. “Establecía un cuerpo de texto donde no hay firma, donde hay un solo autor que es anónimo y atemporal. Una prefiguración de lo que hoy es Wikipedia. Borges dice que la humanidad se puede encontrar en un libro total donde el autor sea la misma humanidad”, acota Lisandro Bregant.

Diversas miradas se han posado este año, con especial interés, sobre la obra de Jorge Luis Borges. A tres décadas de su partida, sus textos continúan cobrando nuevos sentidos. “Cada uno toma como rehén a Borges para sacarle lo que quiere”, dice Bregant con una mueca, acaso sintiéndose responsable de una apropiación casi ilícita. Como parte de ese cosmos textual, a la producción del inmenso autor argentino también le toca ser sometida a sesudas interpretaciones y antojadizos desvíos. Son las reglas de un juego que él mismo promovió.

 

                —Datos a mansalva—
En un terreno menos evidente para alusiones borgeanas, podemos decir que las nociones de información y conocimiento hoy exceden las consultas enciclopédicas en la World Wide Web. Inmersos en una contemporaneidad en que nuestra sociabilidad la definen las características de nuestros dispositivos técnicos, la producción de contenido se torna incesante en cualquier momento y lugar. A través de correos electrónicos, mensajes de texto, llamadas telefónicas, mensajería móvil y posteos en redes sociales engrosamos continuamente el volumen de información cuya sistematización llamamos big data. (Hablando de hipervínculos, revisar el artículo sobre el tema que publicamos en este suplemento en julio pasado).

La cantidad de mensajes emitidos en estos espacios de socialización va en vertiginoso crecimiento, pero no son los únicos que aportan documentación. El universo de datos masivos incorpora también transacciones bancarias, capturas de videovigilancia, controladores de salud, mapas de calor, sensores GPS, escáneres de huellas digitales, entre otras acciones máquina-máquina (M2M). Es decir, cualquier acción que suponga registro puede ser procesada. En cada movimiento hay rastros y dentro de ellos información.

Según un estudio de la corporación Cisco, el tráfico mundial de datos IP en el 2015 alcanzó los 72,5 exabytes mensuales (1 exabyte es equivalente a 1.024 terabytes). El 47% de esa información provino de dispositivos distintos a las PC (smartphones, televisores, tabletas, módulos M2M), lo que marca una tendencia creciente en la portabilidad.

Además del uso científico y militar, el sector comercial ha hecho énfasis en la sistematización y análisis de estos datos masivos para aproximarse al público con campañas publicitarias más personalizadas, que les permitan reducir el margen de error. La identificación de patrones de comportamiento y la predictividad de acciones es lo que nos toca enfrentar como ciudadanos consumidores. “Lo que se manifiesta a través del procesamiento de datos es la pesadilla orwelliana de saber en qué momento y lugar está expuesta una persona para que una empresa le ponga su marca en el grado justo”, refiere Bregant.

En las reiteradas citas a lo que no conoce límites, la obra de Borges parece aproximarse a la esencia del big data: el potencial acceso a datos infinitesimales. Como el lector-creador en los textos de Borges, será la intervención estadística ejecutada por humanos la que deba hilar fino entre lo que sobra y lo que resulta útil en los datos masivos. Las matemáticas acumulan números, cifras, dígitos, pero es el hombre quien direcciona los usos. Riesgosamente, no son muchos los que pueden atribuirse esas facultades.

Para Lorente que el procesamiento de información a gran escala esté en pocas manos puede encaminarnos a la homogenización de la oferta. Estaríamos ante el riesgo de no encontrar cosas nuevas. “Los grandes actores tratan de mostrarnos lo que nos interesa. Probablemente estén equivocados. Uno quiere novedades, no repetir patrones de búsqueda. Los intentos por replicar conductas pueden hacer de la red un lugar mucho menos sorprendente, y nosotros necesitamos sorprendernos”, reflexiona.

En el laberinto borgeano hoy parecen clausurarse varias bifurcaciones. Ante la imposibilidad de experimentar todas las opciones, nos dejamos seducir por los caminos más transitados. La posibilidad de acceder a “uno de los puntos del espacio que contiene todos los puntos”, descrita en “El aleph”, presupone una unidad manejable pero al mismo tiempo inconmensurable, “un lugar donde están, sin confundirse, todos los lugares del orbe, vistos desde todos los ángulos”. Sin embargo, el acceso a esta construcción que condensa la totalidad de las cosas, como los puestos donde se analizan los flujos del océano de datos, tiene cláusulas de exclusividad.

El flujo de datos no cesa. La estadística corre tratando de estar a la par, flexibilizando sus dogmas y ensanchando sus bases. Las ciencias son remecidas por el discurso acaparador del big data, que amenaza medir y cuantificar todos los procesos sociales. Pareciera ya no asustar la posibilidad de que algunos agentes de datos nos conozcan más que nosotros mismos. Mientras tanto, la vida, eso que sucede mientras estamos ocupados, como decía John Lennon, prosigue. ¿En algún momento de este intercambio vertiginoso de información hay tiempo para una pausa? “La velocidad es la nueva censura”, dice el poeta portugués Gonzalo Tavares. “Pareciera que hay una velocidad única, ¿qué espacios por fuera podemos crear?”, también se pregunta Bregant. Volver a generar velocidades propias, que hablen de una tipología de vínculo distinta al del intercambio de datos móviles, parece mucho pedir. La ruta a las raíces asoma cada vez más brumosa y la ventisca nos empuja a avanzar por un mismo sendero.

 

Grandes dimensiones

La Wikipedia entre las manos
En junio de 2015, el artista estadounidense Michael Mandiberg imprimió la versión de Wikipedia en inglés (en ese momento tenía casi cinco millones de artículos) como parte del proyecto Print Wikipedia. Salieron  7.473 tomos de unas 700 páginas cada uno.

Homenaje a Borges
Además de Library of Babel, la réplica digital más exacta de la biblioteca borgeana, el filósofo y programador Jonathan Basile también diseñó Babel Image Archives, un generador de todas las imágenes posibles con 4.025 colores; y Permute Triangle, un perfil de Twitter que publica todas las combinaciones que se pueden hacer en 140 caracteres.

Acceso creciente
La corporación Cisco pronostica que para el 2020 habrá 26.300 millones de dispositivos conectados en el mundo (3,4 por cada habitante del planeta).

Tags relacionados

Jorge Luis Borges

Big Data