Al infinito y más allá: Funes, Borges y big data
En la obra del autor argentino, la relación con lo numérico aparece en forma reiterada; una obsesión por aquello que no tiene límites
Stephen Stigler -uno de los gurús de la estadística científica- provocó un pequeño terremoto al comenzar su flamante libro (Los siete pilares de la sabiduría estadística) diciendo que "Funes es big data sin estadística". La frase no tardó en viralizarse en las redes sociales, esgrimida como mascarón de proa por quienes sólo ven una moda pasajera en la revolución de big data. El Funes en cuestión es el protagonista del celebrado cuento de Jorge Luis Borges, Funes el Memorioso, un extraño personaje que podía recordar todo tipo de detalle, hasta el punto que le tomaba 24 horas reproducir los recuerdos de cualquier día de su vida. Su asombrosa capacidad para memorizar detalles contrasta con su inhabilidad para el razonamiento; según Borges, para Funes "pensar es olvidar diferencias, es generalizar, abstraer".
El boom de big data se refiere a la masiva disponibilidad de información generada por Internet y otros mecanismos electrónicos de interacción social. La crítica de Stigler alude a que sus beneficios provienen no de la disponibilidad de los datos, sino de su procesamiento estadístico. El comentario de Stigler posiblemente sea culposo y autoinmune, emitido desde el seno de una ciencia clásica -como la estadística- cuya hegemonía sobre el análisis de datos se ve amenazada por otras disciplinas afines como la computación o la comunicación.
Ni lerdo ni perezoso, Xiao Li Meng, director del departamento de Estadística de la Universidad de Harvard, lanzó un curso cuyo título es Ireneo Funes y Big Data. Allí revisa las relaciones existentes entre el personaje de Borges, el reciente libro de Stigler y el análisis de datos. A contramano de las propuestas de éxito cortoplacista de algunas sospechosas instituciones educativas, el programa de la materia de Meng dice que "este curso está destinado a aquellos alumnos cuya felicidad pasa por entender los fundamentos filosóficos del razonamiento bajo incertidumbre", promesa que habría hecho huir despavorido al Funes de Borges, suspicaz de las elucubraciones de todo tipo.
Los nexos entre Borges y lo numérico no sorprenden. Afín el gran escritor argentino a las curiosidades del razonamiento, su prosa ha rozado repetidas veces el corazón de la lógica y la matemática. En Borges y la matemática, el escritor y matemático Guillermo Martínez pasa revista a las relaciones entre el universo borgeano y la madre de las ciencias.
William Bloch, profesor del Wheaton College, dedica un libro entero (La matemática inimaginable de la Biblioteca de Babel) a los detalles matemáticos del famoso cuento de Borges. El físico y músico argentino Alberto Rojo lleva el argumento un paso adelante al explorar los vínculos borgeanos con la física, en un ameno y erudito libro: Borges y la física cuántica.
Si bien menos inmediatas, las conexiones entre big data, la estadística y Borges son elocuentes. Quizá la más evidente se encuentre en la famosa (y desafortunada) frase: "La democracia es un abuso de la estadística", en donde don Jorge Luis duda de la relevancia de resolver cuestiones políticas con compulsas populares.
Afortunadamente existen nexos más felices y relevantes. La obsesión con el infinito en la obra de Borges se condice con la promesa de big data, basada en el acceso a una cantidad virtualmente infinita de información. Sus defensores más acérrimos llevan el punto al extremo tal de sugerir que la masiva disponibilidad de datos pude hacer tambalear el monumental edificio de la ciencia tradicional. En un polémico artículo (provocativamente titulado El fin de la teoría: el diluvio de datos torna obsoleto el método científico), Chris Anderson, editor de Wired, una conocida revista hipster sobre nuevas tecnologías, dice: "Basta de una vez con la teoría del comportamiento humano, desde la lingüística a la sociología. Olvídense de la taxonomía, la ontología y la psicología. ¿Quién sabe por qué la gente hace lo que hace? El punto es que lo hacen y que podemos rastrearlo y medirlo con una precisión antes impensable. Con suficientes datos los números hablan por sí mismos", frase que parece haber salido de las entrañas intelectuales de Funes.
Implícita en la revolución de big data está la idea de que lo que daña no abunda. Pero en muchas cuestiones sociales es más importante lo que está detrás de los datos que los datos, a contramano de la opinión de Chris Anderson. A modo de ejemplo, y afín a la vívida creatividad de Borges, imagine el lector el escándalo mediático que provocaría una medición diaria de la pobreza, aun en la circunstancia (lejana) en la que no existiesen dudas de su confiabilidad. A diferencia de algunas cuestiones financieras, los eventos sociales se mueven lento. Cualquier medición de corto plazo sólo refleja variaciones aleatorias ajenas al fenómeno en cuestión. La improcedencia de medir la pobreza con una frecuencia altísima va en la misma dirección que la recomendación a los hipertensos, en lo que se refiere a que se midan la presión arterial frecuentemente, pero no cada cinco minutos, y siempre con la supervisión periódica de un médico. Parafraseando a Anderson, en esta circunstancia, más que hablar por sí mismos, los datos vociferan cacofonía y caos, y es el trabajo de la estadística separar la señal del ruido.
Estas contraindicaciones acerca del exceso de datos son captadas apropiadamente en "Del rigor en la ciencia", donde Borges parece acercarse a la visión cauta de Stigler en relación a los beneficios relativos de big data. Ese cuento relata las peripecias de unos cartógrafos de antaño, que en pos de la precisión absoluta terminan construyendo un mapa de un imperio... ¡del mismo tamaño que el imperio! Borges remata diciendo que "las generaciones siguientes entendieron que ese dilatado mapa era inútil y no sin impiedad lo entregaron a las inclemencias del sol y los inviernos", resaltando, magistralmente, la tensión entre lo bueno y lo útil: en algún momento la precisión del mapa atenta contra su utilidad.
Y es quizás El Aleph el que sugiera un balance entre las ventajas de la masividad y la necesidad de imponer orden en el mar de información infinita. El aleph aludido por el cuento de Borges es "uno de los puntos del espacio que contiene todos los puntos". Llamativamente, el punto en cuestión no es en realidad un punto, sino, a decir de Borges, una suerte de esfera de "dos o tres centímetros" de diámetro que contiene "todos los lugares del orbe, vistos desde todos los ángulos". Borges juega con la posibilidad de que una infinita cantidad de visiones sea contenida en una figura geométrica que no es ni infinitamente pequeña ni infinitamente grande.
El gran desafío de big data es que un océano de información quepa en un continente manejable y útil para la toma de decisiones, y este es exactamente el rol que la masividad de la información plantea a la estadística y sus usuarios.
"Cambiará el universo pero yo no", dice Borges en el primer párrafo de El Aleph, para contradecirse al finalizar el cuento afirmando que "yo mismo estoy falseando y perdiendo, bajo la trágica erosión de los años, los rasgos de Beatriz", su amor imposible en el relato. Funes es big data sin estadística. Pero la estadística sin big data corre riesgos de ser absorbida por sus competidores. A menos que cambie, como el Borges sincero de El Aleph.
Profesor de la Universidad de San Andrés e investigador principal del Conicet