“La verdadera encuesta es el 10 de abril”: con esta frasecita –cambiando solamente la fecha cada cinco años– suelen minimizar el valor de los sondeos de opinión los candidatos que no aparecen en los primeros lugares. A veces lo dicen con optimismo; otras, con ilusión; pero, por lo general, quejándose veladamente sobre un supuesto sesgo en su contra. El lector no tiene por qué exponerse al contagio de esa necedad.
Lo que sucederá este 10 de abril no es ninguna encuesta, sino una votación. Ese, obviamente, es el único resultado que importa. Las encuestas no son más que un pronóstico, una extrapolación de lo que un número reducidísimo de votantes dice que va a hacer el día de las elecciones. ¿Qué nos lleva a pensar que las respuestas de unos cuantos cientos de personas son suficientes para darnos una idea fidedigna del escrutinio final?
Imaginémonos una enorme urna que contiene 100.000 bolas. Hay 30.000 anaranjadas –pero eso usted no lo sabe– y cantidades menores de otros colores. Si quiere, puede ponerse a contarlas una por una, pero se va a tardar una eternidad. Tome mejor una muestra aleatoria: “chocolatee” bien primero la urna, cierre los ojos y saque, digamos, 400. Ahora sí póngase a contarlas. Si salieron 120 anaranjadas, 60 rosadas, etc., usted puede inferir que en toda la urna el 30% debe de ser de tal color, el 15% de tal otro y así sucesivamente.
No podemos tener certeza de los porcentajes reales porque no hemos contado todas las bolas. Pero sí podemos confiar en que difícilmente estarán muy por encima o por debajo de lo que arroja nuestra muestra, gracias a una rama de las matemáticas conocida como análisis combinatorio, que nos dice cuántas maneras distintas hay de sacar 400 bolas de una urna que contiene 100.000.
Si en la urna hubiera solamente 120 bolas anaranjadas, sería extremadamente raro que las 120 aparecieran en la muestra. Hay pocas combinaciones, entre millones de posibilidades, que producen precisamente ese resultado. Pero si hubiera 20.000 (el 20% del total), no sería tan extraño que el 30% de nuestra muestra fuera anaranjado. Y si hubiera 25.000, lo sería menos aún. Lo más probable, en base a nuestra muestra, es que sean 30.000.
Podemos calcular también la probabilidad de que el número de bolas anaranjadas en la urna esté dentro de un determinado rango. Si son el 30% de la muestra, habrá un noventa o noventa y cinco por ciento de probabilidad de que en toda la urna haya entre veintiocho mil y treinta dos mil, o sea, que esa candidatura obtenga entre 28% y 32% de los votos. El mismo cálculo se puede hacer para las demás candidaturas. Eso es lo que el margen de error de las encuestas nos trata de decir.
El arte del encuestador, sin embargo, no está en tabular las respuestas de los encuestados; eso lo puede hacer mejor una computadora. La clave está en diseñar una muestra que sea representativa. Para que tenga valor predictivo, tiene que estar adecuadamente diversificada: por grupo de edad, por estrato socioeconómico, por lugar de residencia. Si a los 400 los entrevistamos saliendo de una casa en el Paseo Colón o la avenida Alfonso Ugarte, el resultado será uno; si vamos a buscarlos a lo largo y ancho del país, el resultado será otro. Los candidatos que apelan al calor popular que sienten en las calles saben que no están hablando de una muestra representativa.