Balance 2016. Encuestas y big data: no matemos al mensajero
Criticados por sus errores de pronóstico, los sondeos y modelos estadísticos tienen un rol más relevante: medir grados de incertidumbre
Tire una moneda al aire, anote si salió cara o ceca e intente predecir el resultado del próximo tiro. Repita el ejercicio a piacere: diez, cien, mil, un millón de veces. Y asómbrese del hecho de que no importa cuántas veces haya tirado la moneda, jamás llegará un punto en el que pueda predecir con exactitud el resultado del próximo tiro.
Entonces, ¿sirve haber estudiado los lanzamientos previos? Para predecir con exactitud el resultado futuro no, pero sí para algo que posiblemente sospechaba antes de lanzar ninguna moneda: que las chances de que salga cara y ceca eran prácticamente iguales. O sea que los datos son de poca utilidad para un propósito (predecir si saldrá cara o ceca) pero de mucha para otro: mensurar las chances de que salga un resultado o el otro.
Algo similar ha ocurrido con las encuestas el año que termina en relación con episodios sociales como las elecciones en Estados Unidos, el referéndum sobre el tratado de paz en Colombia o el Brexit. Tienen en común estos eventos que fueron bastante reñidos y que pusieron en el banquillo de los acusados a las encuestas y el big data, juguete de moda de la ultima temporada.
Si bien estos episodios dejan importantes lecciones sobre el diseño de las estadísticas, existe una cuestión relevante y de la que poco se habla: estos hechos fueron complejos y estratégicos, y de ahí se deriva su impredicibilidad, mas allá de big o small data.
El clima y la política son muy difíciles de pronosticar, pero por razones completamente distintas. El primero porque es resultado de complejas interacciones dinámicas y muy sensible a condiciones iniciales. Y es en este ámbito complejo y no lineal donde la matemática y los datos tienen mucho para aportar.
La cuestión social también es compleja, pero además es estratégica: ir a votar y qué votar depende de lo que el votante crea que hará el resto y viceversa, como en el tatetí o cuando se patean penales. Como dijo David Levine (un brillante analista económico), "la razón por la cual los modelos de big data no predijeron la elección es simplemente porque no se podía predecir". El comportamiento estratégico introduce una impredecibilidad intrínseca, invisible aún a la luz de muchísimos datos, como en el caso del lanzamiento de la moneda.
Entonces, ¿son completamente inútiles las encuestas y los modelos de big data? No. Y, en forma análoga al ejemplo de las monedas, si bien no son capaces de predecir con exactitud el resultado, bien utilizados y diseñados pueden medir muy bien el grado de incertidumbre, una tarea crucial en la cuestión social. Estos episodios que pusieron en jaque a las encuestas y el big data hablan de la enorme complejidad inherente a las cuestiones sociales. No matemos al mensajero.
El autor es profesor de la Udesa e investigador principal del Conicet