Por: José Carlos Mariátegui
A Raquel Chang-Rodríguez
El 4 de agosto pasado falleció inesperadamente Eugenio Chang-Rodríguez, lingüista-matemático y crítico literario peruano radicado en Nueva York. Fue fundador de la Academia Norteamericana de la Lengua, profesor emérito de la City University of New York, presidente de la International Linguistic Association (durante casi una década), editor de la revista WORD (por treinta años), entre otros innumerables méritos académicos. A Eugenio y Raquel Chang-Rodríguez los conocí desde mi infancia, pues eran muy amigos de mis padres y siempre mantuve con ellos una amistad cercana, casi familiar. Chang-Rodríguez tuvo desde muy joven un interés en la obra de Mariátegui, como lo evidencia su tesis de doctorado en Lingüística y Literatura por la Universidad de Washington titulada La literatura política de González Prada, Mariátegui y Haya (195646).
—Lingüística computacional—
Quisiera detenerme en un aspecto poco conocido de su investigación científica: el Frequency dictionary of spanish words (the romance languages and their structures) —que en español es Diccionario de frecuencias de las palabras del español—, en coautoría con Alphonse Juilland y editado por Mouton & Co. en 1964. Se trata de un trabajo pionero en el uso de la computación para el estudio de la lingüística y que permitió determinar las frecuencias de palabras en el idioma español a partir del análisis de 500.000 términos de diversos textos.
En 1956, Chang-Rodríguez fue contratado como profesor asistente en la Universidad de Pensilvania, lugar de nacimiento de la ENIAC, la primera computadora electrónica de uso general y que sirvió para calcular las tablas de tiro de artillería en el Laboratorio de Investigación Balística del Ejército de Estados Unidos. Para ese entonces, los creadores de la ENIAC, J. Presper Eckert y John Mauchly, ya habían introducido una de las primeras computadoras comerciales: la UNIVAC (acrónimo en inglés de Universal Automatic Computer).
Chang-Rodríguez se interesó por la lingüística computacional debido a la posibilidad de develar si algunos textos que aparecen como anónimos pertenecen o no a escritores reconocidos. Sin embargo, en aquellas épocas el costo de procesamiento computacional era alto y los especialistas a cargo del uso de la UNIVAC en la Universidad de Pensilvania la limitaban a proyectos y métodos científicos. Para convencerlos del uso computacional de la colosal máquina, Chang-Rodríguez sustentó las bases científicas de su propuesta de investigación argumentando que la narrativa literaria es una combinación compleja de signos lingüísticos y que para descifrar su real magnitud era necesario descomponer dichas combinaciones mediante modelos matemáticos.
El uso del poder computacional de la UNIVAC le permitió a Chang-Rodríguez desarrollar una serie de estudios sobre las propiedades del idioma castellano que contribuyeron sustancialmente al campo de la lingüística matemática. El modelo de Chang-Rodríguez y Juilland fue pionero para su época. Incluso, fue objeto de dos tesis doctorales defendidas en la Universidad de Stanford —por Héctor Norberto Urrutibeheity (1967) y William Taylor Patterson (1968)—. En Italia, la misma metodología permitió la creación de un diccionario de concordancias y frecuencias del léxico poético de César Vallejo.
—La estilometría—
Ciertamente, el trabajo emprendido por Chang-Rodríguez hace 60 años fue una demostración clara de cómo el arte y la inventiva se pueden combinar con la investigación científica para descubrir un método original que permite detectar estilos literarios de autores no identificados. Una técnica derivada de la lingüística computacional es la estilometría, que ha dado lugar a complejas aplicaciones de software para la detección de plagios hasta pruebas forenses de identidad.
La mayor parte del conocimiento formal del mundo se ha construido a través de referencias producidas a partir del texto escrito. Sin embargo, la narrativa literaria evoluciona con el tiempo y depende de la comprensión de un contexto social y de un método científico para entenderla. Por ello, la lingüística es, como explicaba Eugenio Chang-Rodríguez, “la más humana de las disciplinas científicas, y las más científica de las humanidades”.