La pandemia del COVID-19 nos viene retando como sociedad desde diferentes ángulos. Ser capaces de hacerle frente con éxito demanda contar con información precisa y oportuna sobre la evolución del avance de la enfermedad en nuestro país. Sin embargo, como era de esperarse, producir información precisa en este contexto es particularmente difícil y supone un enorme desafío. Así, las estadísticas oficiales se generan con cierto rezago a partir de un proceso complicado. Ahora bien, problemas complejos requieren precisamente buscar soluciones fuera de la caja. En ese sentido, ¿podemos emplear las búsquedas en Google para anticipar la evolución del coronavirus y así complementar la información oficial? Siguiendo un ejercicio semejante desarrollado por nuestros colegas de la PUC de Chile para el país sureño, decidimos indagar en qué medida estas búsquedas podían ayudarnos a predecir el nivel de contagio y generar, de esta manera, información en tiempo real que ayude a tomar decisiones y formular acciones.
La idea detrás de este ejercicio es sencilla: las personas cuando empiezan a sentir síntomas asociados con el coronavirus, tienden a llevar a cabo un mayor número de búsquedas en Google de palabras relacionadas tanto con dichos síntomas como con las pruebas para descartar la enfermedad. En la medida en que estas búsquedas se suelen llevar a cabo antes de que las personas se hagan efectivamente las pruebas de descarte, estas tienden a poder predecir los reportes de personas contagiadas. Si en un determinado momento se observa un mayor número de búsquedas de estas palabras, uno puede inferir que el número de contagios ha aumentado en cierta área geográfica. De esta manera, las búsquedas de estas palabras claves en Google pueden servir como una alerta temprana sobre la evolución de la pandemia.
MIRA: ¿Reprogramar o refinanciar?: El mejor camino para honrar las deudas
DATOS ABIERTOS
Para desarrollar este ejercicio, empleamos la información brindada por el portal de datos abiertos del Gobierno Peruano. Un punto importante por notar: gracias a que el Gobierno ha puesto estos datos sin procesar a disposición de todos, diferentes actores –como nosotros– pueden analizar la información con diferentes técnicas y desde distintas perspectivas, lo que solo puede enriquecer la discusión.
De manera específica, nosotros usamos los datos de personas positivas o contagiadas de COVID-19 reportadas. Estas estadísticas son ingresadas en el portal con un rezago de alrededor de dos días (por ejemplo, este análisis se desarrolló el 23 de julio con información hasta el 21 de dicho mes). Este rezago es entendible, pero la pregunta que surge es cómo utilizamos un método alternativo para suplir esta brecha de información y adelantarnos al virus. Es ahí donde entran a jugar las estadísticas provistas por Google. En particular, nosotros usamos términos de búsqueda como “tratamiento covid”, “prueba rápida” y “prueba molecular”, que muestran una capacidad predictora relevante. Nuestro ejercicio consiste finalmente en predecir con unos días de anticipación la evolución de los contagios, usando tanto la información histórica de esa variable como las búsquedas de Google. Así, este es un ejercicio de lo que se denomina ‘nowcasting’, es decir, la generación de información en tiempo real para ayudar a tomar decisiones. Buscamos que el 23 de julio, en el que solo se cuenta con información revisada de hasta dos días previos, se pueda tener un indicador contemporáneo del comportamiento del nivel de contagios en esa fecha.
El resultado de nuestro ejercicio se puede observar en el gráfico adjunto. Como se puede apreciar, nuestro indicador muestra una evolución semejante a la estadística real y es capaz incluso de anticiparla. Más importante aún, nuestro indicador puede predecir correctamente cambios en la tendencia. Así, por ejemplo, fue capaz de predecir el cambio de tendencia de finales de mayo y el comportamiento posterior.
Adicionalmente, las tendencias de búsqueda de Google pueden ayudarnos a generar alertas tempranas sobre la dispersión geográfica del virus. Así, los patrones de búsqueda de hace siete semanas ya alertaban sobre los problemas que regiones como Loreto o Áncash iban a tener y hoy muestran los problemas que Arequipa viene teniendo. El uso de este tipo de información puede ser particularmente útil para las autoridades, pues permite anticipar potenciales necesidades y requerimientos de diferentes regiones del país. Estas búsquedas, además, reflejan en última instancia la preocupación creciente de la población ante el avance del coronavirus.
PARA QUÉ SIRVE Y PARA QUÉ NO
Los indicadores generados con este tipo de métodos deben ser entendidos como insumos complementarios para analizar la evolución de la pandemia. Es importante notar sus limitaciones. En primer lugar, en tanto buscan predecir las estadísticas oficiales de personas positivas de COVID-19, preservan los problemas que dichas estadísticas pueden presentar. Asimismo, en la medida en que se basa en las búsquedas de Google, su eficacia se relaciona con el acceso a Internet de la población, por lo que tenderá a subrepresentar a ciertos segmentos de la sociedad. En ese sentido, es poco probable que pueda ayudar a anticipar el avance de la pandemia en áreas rurales o en regiones alejadas de la Amazonía, donde el nivel de penetración de Internet es menor. Sin embargo, y a pesar de estas limitaciones, el uso de este tipo de indicadores puede ayudar a tomar decisiones con prontitud, en circunstancias donde hacerlo puede marcar la diferencia.
*Este artículo fue escrito por Oswaldo Molina (Director de la Maestría en Economía de la Universidad del Pacífico), Andrés Regal (analista de proyectos de Analítica y Big Data de la Facultad de Ingeniería de la Universidad del Pacífico), Michelle Rodríguez (decana de la Facultad de Ingeniería de la Universidad del Pacífico) y Diego Winkelried (jefe del Departamento Académico de Finanzas de la Universidad del Pacífico).
TE PUEDE INTERESAR
- Sunat: Inició el vencimiento para presentar la declaración jurada ¿Quiénes están obligados a presentarla? | VIDEO
- Indecopi plantea proyecto de ventanilla única para solucionar reclamos de consumidores
- Minagri destrabará la ejecución de la tercera etapa del proyecto Chavimochic
- Saga, Tottus, Plaza Vea y otras tres empresas piden disculpas por retrasos en entrega de productos
- El ritual de las despedidas: Soyuz y las marcas que salieron del mercado debido a la crisis sanitaria