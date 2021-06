Conforme a los criterios de Saber más

Los fraudes no se prueban en silencio; se gritan las sospechas, se marcha pidiendo la revisión de todo lo que se pueda revisar, se lloran las cifras supuestamente distorsionadas. El fraude denunciado por Fuerza Popular empezó ponchando presuntas irregularidades (firmas de miembros de mesa que podrían ser falsas y parentescos entre ellos), que en sí mismas no significaban nada si de ahí no se deslizaba el alegato fujimorista al meollo del asunto, los números adversos. Ahí vamos.

En la primera conferencia de prensa en la que Fuerza Popular aportó los indicios que sustentaban su relato, el miércoles 9 de junio, se incluyeron muestras de actas en las que se dijo que Keiko Fujimori había obtenido muy pocos votos en relación a mesas vecinas o en relación a la primera vuelta. Sin embargo, ello no fue la parte esencial de la denuncia, quizá porque habían detectadas muy pocas ocurrencias. Era una casuística que no llegaba a estadística.

Lourdes Flores fue la primera en hablar de una ‘distorsión estadística’, en la mañana siguiente, en RPP. No aportó cifras pero aseguró que con un equipo de colaboradores había estudiado las hasta ese momento más de 800 actas impugnadas con recursos de nulidad y encontrado que Keiko Fujimori tenía cifras sospechosamente bajas en relación a la primera vuelta. No era una muestra del universo sino solo de unos cientos de actas en las que ganaba Castillo, de modo que no se cumplía un requisito mínimo esencial de cualquier detección de fraude: que se estudie al universo, no a un solo lado. Pero ya venían, de un lado y del otro, estudios que sí se zambulleron en el magma.

Ragi, tuit y mutis

Ragi Burhum, el científico de grata recordación desde que escribió “El martillazo y el huayno” en mayo del 2020 y dedicó análisis y proyecciones a la pandemia, se metió en la danza electoral. Las proyecciones sobre el COVID-19 son, digamos, inofensivas, pues no van a variar sustancialmente la lucha contra la plaga; pero decir que hay irregularidades en una apretada segunda vuelta, vaya que tiene consecuencias.

Ragi Burhum había incursionado con buen en el análisis de cifras de la pandemia. No le pasó lo mismo en el terreno electoral.

El hilo de Burhum apareció el 13 de junio encabezado por un tuit en el que se preguntaba, “¿hay irregularidades potenciales en estas elecciones que se pueden detectar con datos?” y se respondía: “Un rotundo sí”. Sus resultados los graficó con 8 ejemplos, que perjudicaban a ambos partidos. No incluyó al universo entero (le faltó el extranjero) y no dio muchas precisiones sobre su metodología, salvo que había creado un algoritmo para detectar las mesas que se desviaban en demasía de su promedio en el centro de votación.

Burhum no hizo nada descabellado ni caprichoso. El análisis de ‘outliers’ o casos atípicos, es una buena aproximación para intentar averiguar si hay un fraude sistemático. Encontró 142 mesas de sospecha muy alta, 2460 con sospecha alta y 2074 con algo de sospecha; haciendo un total de 4676 mesas. No sumó, o por lo menos, no dijo, a quién perjudicaban más esas actas sospechosas, pero su reiterada mención a la palabra ‘irregularidad’ hizo que Fuerza Popular enarbole sus hallazgos.

Ante la arremetida del anti keikismo y de otros investigadores, Burhum hizo mea culpa y mutis. Ni siquiera había hablado de fraude. Otro científico de los datos, Saki Bigio, hizo un rescate de los hallazgos de Burhum, señalando sus límites y admitiendo que el terreno electoral tiene peculiaridades que se deben conocer antes de exponer sospechas.

Ipsos y los ‘outliers’

El Instituto Pro Democracia, presidido por Ramiro Fernando Prialé, tuvo una estupenda idea: encargarle un estudio a Ipsos Perú para confirmar o descartar las especulaciones sobre un fraude sistemático. Conversé con Prialé, cabeza de este instituto que nació a fines del año pasado, y me contó que la idea se les ocurrió porque querían ayudar en el debate y aportar recomendaciones a los organismos electorales para detectar rápidamente anomalías.

Prialé habló con Ipsos Perú y fueron estos quienes plantearon el método: el análisis de los casos raros. Primero quisieron concentrarse en algunas regiones, pero la disponibilidad de la data abierta en la ONPE, los hizo zambullirse en el todo. Incluyeron la votación en el extranjero y, a diferencia de Burhum, no solo analizaron las desviaciones extremas respecto del promedio de cada local de votación, sino del distrito. Los resultados desarman la teoría de fraude sistemático:

En primer lugar los casos atípicos o outliers son relativamente pocos (4,71%) y se reparten hacia ambos lados (2,31% favorece a Fuerza Popular y 2,41% favorece a Perú Libre. Los casos en que un partido no tuvo votos son 87 (70 mesas en la que FP no tuvo ninguno y 17 en las que PL no tuvo ninguno). Un tercer hallazgo es que no hay evidencias sobre concentración geográfica de los outliers, lo que desmonta las sospechas de fraude sistemático en algunas regiones donde un partido concentra a activistas y electores.

Por supuesto, ni este ni otros enfoques pueden detectar casos aislados de mesas en las que, en ausencia de personeros, se pueda haber hecho trampa. Pero de haberse hecho en un gran volumen ello debiera ser detectado por el enfoque de los casos raros.

Keiko no sacó 0

Una desproporción sí llama la atención en las conclusiones de Ipsos. De las actas con cero votos para un partido, PL solo tiene 17 y FP tiene 80, más del cuádruple. ¿Evidencia de fraude? No, pero sí alerta de que hay cosas que explicar. Las ciencias sociales, incluyendo la psicología social, pueden dar razones de por qué, en algunas zonas donde predomina un partido, la presión social es tal que silencia o ausenta al votante contrario. Se puede presumir que Castillo arrasa con la intención de voto en zonas donde la población es más homogénea, incluyendo fuertes lazos comunales; mientras que Keiko lo hace en zonas donde el electorado es menos cohesionado y más independiente.

Daniel Córdova ha sido uno de los principales difusores de la tesis de distorsión estadística como indicio de fraude.

Aún así, son casos que merecen estudiarse. Ipsos hizo, como ejercicio, el cálculo de qué pasaría si se excluyen esas mesas, y el resultado, teniendo como referencia el conteo final al 100%, es que no se invertirían los resultados. ¿Pero por qué contentarse con cero y no hacer el cálculo, digamos, con aquellas mesas donde uno de los dos candidatos haya obtenido entre cero y 5 votos? En un rato lo hacemos.

Conversé con el economista Daniel Córdova, que fue jefe del equipo técnico de APP y ahora es defensor entusiasta de Keiko Fujimori y promotor de los enfoques estadísticos que sí validan la hipótesis de fraude. Uno de ellos, liderado por José Ignacio Beteta, muestra que la curva de Gauss, método para ver si la distribución de casos en un universo tiene una forma normal de campana, arroja un resultado anormal para FP y normal para Castillo. Ello sería, en la argumentación del estudio, un indicio de que se han manipulado votos para perjudicar a FP.

Ciertamente, resultados totales aparte, este enfoque demuestra que las votaciones de ambos candidatos son muy distintas. Por ejemplo, PL obtiene entre 0 y 30 votos en solo en 2757 mesas, mientras Keiko Fujimori lo hace en 9,557, más del triple. El electorado de Castillo es más concentrado, el otro es más disperso. Más allá de estas diferencias fácticas y no culposas, y de las recomendaciones sobre la inconveniencia de aplicar la curva de Gauss a la complejidad del electorado; habría que explorar las distintas respuestas que pueden ofrecer las ciencias sociales a esa disparidad. Luis Chía ha aplicado la curva de Gauss a otros candidatos en otras elecciones, y encuentra similares disparidades.

Ahora sí, lo prometido. El estudio hace el cálculo de qué pasaría si se anulan todas las mesas donde uno de los dos partidos tuvieron entre 0 y 5 votos. Resulta, según el estudio de Beteta, que en esas mesas PL suma 137,234 votos mientras FP solo 15,937. Si se anularan, habría una diferencia de 77,057 votos a favor de Keiko, más de los que necesita para voltear la elección. Por supuesto, este es un mero un ejercicio, pues ni FP plantea tal cosa; solo es un enfoque de detección de desproporciones entre candidatos.

Valga el criptoanálisis

Arturo Arriarán, ex marino e ingeniero de sistemas, presentó el domingo pasado en “Cuarto poder” un estudio con un enfoque enteramente distinto al de Beteta, aunque también basado en el supuesto de una distorsión estadística. En su caso, no se basa en la data única de la segunda vuelta, sino que la refiere a la primera. Para eso ha elaborado un modelo de trasvase de votos, estableciendo un mínimo que debiera ser replicado en cada mesa para Keiko respecto a lo que tuvo en primera vuelta, sumada una estimación de lo que otros partidos con electorados afines debieron traspasarle.

El estudio es ambicioso y asegura haber hecho cálculos diferenciados por regiones. Sin embargo, por más fineza y ajustes que haga Arriarán, abstraer la inmensa cantidad de factores que pudieron variar el voto en las varias semanas de la segunda vuelta, es una operación temeraria. Por solo poner una consideración: ¿Qué pasaba si Castillo mantenía la ventaja que le dieron las encuestas antes del debate en Chota? No estaríamos discutiendo estas cosas. Sin embargo, aclaremos que estos enfoques no sirven para predecir quién debe ganar y por cuanto, sino, básicamente para detectar anomalías en el comportamiento de algunas mesas.

El propio Arriarán se presentó como experto en criptoanálisis (disciplina que busca encontrar las debilidades en sistemas encriptados), pero en lugar de invocar seriedad con ello, fue víctima de la mofa ante lo que se tomó por pompa científica. En realidad, en su invocación al criptoanálisis –y en su informe que tengo a la mano, que no solo analiza cifras sino que cita a una fuente de ‘inteligencia’- se agazapa el pensamiento conspirativo que busca descifrar la huella que habría dejado una organización internacional fraudulenta. Ahí dejamos la presunta distorsión estadística para pasar a la pura teoría del complot.

El resultado de los cálculos de Arriarán es que habría 8,457 actas irregulares, de acuerdo a su modelo de trasvase, y en el 99.6% de esas actas, el perjuicio sería para FP. Con tal magnitud de actas, si todo se ‘regularizara’, de más está decir que FP daría un volteretazo triunfal. Por tercera vez, hay que traer a colación, antes de gritar fraude, las respuestas de las ciencias sociales a las presuntas anomalías. El investigador Hugo Ñopo señala algunas en un extenso hilo: hay gente que no votó en primera vuelta y luego sí lo hizo, o que votó nulo y luego se decidió por uno de los dos o, aunque parezca estrambótico, cambió entre Keiko y Castillo o viceversa. Añado una aguda observación que me hizo Ramiro Prialé a propósito de este análisis: Arriarán concluye que hubo fraude en la segunda vuelta, pero su modelo presume que no lo hubo en primera, cuando bien se sabe que es más probable la existencia de fraudes en las primeras vueltas debido a la proliferación de candidatos y de resultados apretadísimos para definir las cuotas parlamentarias.

Claro que hay modelos

Bienvenidos a la ciencia de detección de mesas, resultados y hasta conteos raros. Gracias al economista Pablo Lavado, profesor investigador de la Universidad del Pacífico, he leído dos modelos de detección indirecta de anomalías. Hay varios y son muy distintos y distantes de la simple y contundente detección de mesas raras o ‘outliers’.

El lunes 21 apareció un comunicado de un grupo multidisciplinario de investigadores peruanos dispersos en varias universidades del mundo que deploraba “el uso irresponsable de análisis estadísticos y opiniones en los medios de comunicación y redes sociales”. Analizaban, como ejemplo de su rechazo, los casos de Arriarán, Lourdes Flores y Burhum; y destacaban los estudios de Ipsos y de Lavado.

¿Qué hizo Lavado? Pues aplicó los modelos de Beber y Scacco (What the Numbers Say: A Digit-Based Test for Election Fraud, revista Political Analysis, 2012) y el de Arturas Rozenas (Detecting Election Fraud from Irregularities in Vote-Share Distributions, publicado online por Cambridge University Press, 2017). El de Beber y Scacco es un complicado test pero se los resumo así para que vean la simple lógica sobre la que reposa: Se asume que en una recopilación normal y aleatoria de cifras, como en la de actas electorales, los últimos dígitos van a tener una frecuencia similar de aparición del 0 al 9.

Pablo Lavado, profesor e investigador de la Universidad del Pacífico, aplicó dos tests antifraude y aseguró no encontrar pruebas de este.

¿Pero qué pasa si se repiten mucho algunos dígitos? Bever y Scacco han encontrado que cuando los dígitos no son aleatorios, sino resultado de la manipulación, tienden a ser pequeños, adyacentes y evitan repetirse inmediatamente. En base a ese patrón elaboraron un modelo y lo aplicaron a los resultados de elecciones en las que se acusó fraude, como las de Nigeria en el 2003 y Senegal en el 2007. Allí encontraron la distorsión humana e incluso demasiadas mesas con números terminados en 0, lo que hacía pensar tanto en pereza como fraude. Al revés, al probar el modelo con elecciones reputadas como limpias, no se detectaba ninguna distorsión.

Lavado ha aplicado el test de Bever y Scacco y según muestra en su hilo, los resultados son parejos, no ‘saltan’ ante la reiteración anómala de últimos dígitos. La probabilidad de fraude es de 6%, dentro del rango aceptable por el modelo (hasta 9%). Hay otros tests basados en el análisis de dígitos, según los describe y enumera Rozenas en el artículo citado, antes de proponer su propio método. ¿Cuál es? Que suene la alarma de fraude cuando los porcentajes por los que gana un candidato en cada mesa son, en muchos casos, redondos o múltiplos de 5 (20%, 25%, 50%, 75%). En un amplio universo de mesas esto puede pasar con cierta frecuencia, pero sí se repite en demasía, delataría el afán fraudulento de manipular las cifras dándole triunfos porcentualmente redondos a un candidato. Rozenas probó su test con elecciones imputadas como fraudulentas en Rusia y mostró su utilidad.

Pablo Lavado afirma también haber confrontado nuestra segunda vuelta con el test de Rozenas, sin hallar porcentajes de alarma. Si hacemos un balance de todo lo que les he contado, más son los estudios que descartan fraude sistemático, incluyendo el de Ipsos al 100% de las actas contabilizadas; que aquellos que lo confirman. Prialé, que encargó de Ipsos, hace una sugerencia proactiva para las elecciones del futuro: que los propios organismos electorales confronten su data con los tests más reputados y difundan los resultados, antes de que los bandos empleen enfoques dudosos para agarrarse a patadas.

