Cuando en 1924 El Comercio estrenó su nuevo local en el Centro de Lima, se reservó un área para su Hemeroteca. Poco a poco las estanterías de caoba se fueron llenando con tomos de tapas negras que contenían las ediciones del diario decano desde su fundación en 1839.
Estos tomos fueron utilizados por nuestros periodistas hasta que a mediados de los años 70 los diarios comenzaron a ser microfilmados. Para la época fue un gran avance porque se podía buscar información sin necesidad de usar los tomos, asegurando así su conservación.
Cuando la pandemia envío a los periodistas a sus casas, ellos ya no tenían acceso a los tomos ni al microfilm. El viejo anhelo de digitalizar la hemeroteca cobró mayor fuerza. Era la hora de dar otro paso hacia adelante.
Es así como el proyecto de digitalización comenzó a tomar forma en mayo del 2021. Con Silvia Miró Quesada a la cabeza, se reunió a un equipo multidisciplinar de las áreas de archivo, plataforma editorial, administración y mantenimiento.
Primero se definió que la digitalización abarcaría desde mayo de 1839 hasta diciembre de 2012. De acuerdo a eso se proyectó que se digitalizarían unos 2000 tomos de periódicos de los siglos XIX a XXI
Lee también: “Cuenta la Historia”: Gonzalo Torres se sumerge en las historias del archivo histórico de El Comercio
Otro aspecto importante fue definir los formatos en qué se digitalizarían las páginas. Se optó por tenerlas en TIFF (formato de mayor calidad) y PDF con capacidad de reconocer caracteres. El almacenamiento sería en la nube y en discos externos. Tener copias de respaldo es indispensable en todo proyecto de preservación digital.
¿Cómo lograr que miles de páginas migren a un entorno digital para ser preservadas y consultadas?
Al digitalizar nacen nuevos documentos que deben ser preservados. Además este archivo digital, generado en alta calidad, es la materia prima sobre la que se realizarán otros procesos, como la conversión de los textos impresos en caracteres.
La empresa AyD Asociados asumió el reto y desarrolló una solución tecnológica única en el medio para que las páginas del diario tengan la mayor legibilidad y calidad visual posible.
Roberto Barrientos, jefe de operaciones de la empresa, nos comenta: “la digitalización nace de un formato TIFF que nos permite tener la imagen de alta calidad. Como el fondo es amarillento, por la antigüedad misma de las hojas, el sistema captura las diferencias de tonalidades que hay en el documento. Cada tonalidad representa un código sexagesimal. Estos códigos se aplican a todas las páginas. Así se logra mejorar la nitidez de los caracteres y calidad de la imagen”.
Por otro lado, para convertir la imagen en caracteres y así realizar búsquedas textuales, los especialistas escogieron un programa de OCR adecuado para las necesidades de este proyecto. Con este programa se logra reconocer más del 90% de caracteres. Todo ello depende, como afirma Barrientos, del estado de conservación de las páginas, tipo de impresión y un buen programa de OCR.
Unos 20 operarios y operarias, divididos en tres turnos, hacen posible la digitalización. La meta diaria son 12,000 páginas que comprenden 9 tomos.
La línea de producción comienza con la captura de las páginas en un escáner Book Eye 4 traído desde Alemania especialmente para este proyecto. Luego se realiza el recorte de las imágenes, control de calidad, renombrado, consolidado de información y copiado a nuestros discos. Al momento de esta publicación, la digitalización ya llegaba a junio de 1979.
“Si el monumental archivo de El Comercio desapareciera, se perdería el mayor registro periodístico del Perú republicano. Protegerlo y garantizar su preservación es vital. Hoy podemos anunciar que nuestra memoria está a salvo y muy pronto estará al alcance de estudiantes y lectores quienes podrán viajar en el tiempo a través de nuestras páginas”.
El proyecto comenzó en agosto del año pasado y hasta la fecha han digitalizado 589,440 páginas que comprenden los años 1839 a 1966. Para octubre de este año se finalizará la digitalización.
Cada mes nos entregan entre 200 a 250 mil páginas digitalizadas. En este punto, personal de archivo realiza un exhaustivo control de calidad e ingresa las páginas a nuestro sistema de consulta online. Este proceso cuenta con el soporte de plataforma editorial.
Hasta el momento unas 270,000 páginas ya pueden ser consultadas por los redactores; es decir, desde 1839 hasta 1934.
El siguiente paso será poner a disposición esta hemeroteca digital para consulta al público. En una primera etapa se realizarán convenios con universidades para que los estudiantes sean los primeros en acceder a este material.
Todas las semanas nuestro Archivo Histórico publica crónicas, perfiles y trivias en: www.elcomercio.pe/archivo-elcomercio/ Puede adquirir portadas, fotos y otros recuerdos en: www.tiendaelcomercio.com
En la página A2 del Diario encontrarán la pieza: “Un día como hoy hace 100 años” escrita por el historiador Héctor López Martínez. El autor también publica todos los lunes una página con historias de nuestro archivo.
Pronto estrenaremos “Cuenta la historia”, un programa web conducido por el actor Gonzalo Torres que será un fascinante viaje al pasado a través de nuestra hemeroteca.
Contenido GEC