Big data, el alud digital que cambió al mundo
La información que generan los dispositivos conectados a la Red es una usina de posibilidades que, a la vez, plantea desafíos al derecho a la intimidad
Nada es privado, documental disponible en Netflix, indaga en el escándalo que, en marzo de 2018, hundió a la empresa Cambridge Analytica cuando se reveló que Facebook le había entregado ilegalmente información de millones de perfiles de usuarios. La película no solo pone el foco en las denuncias de manipulación electoral (la empresa británica trabajó para las campañas de Donald Trump en Estados Unidos y la del Brexit en Gran Bretaña), sino también en la vulneración del derecho a la intimidad y en el poder abrumador de un elemento tan omnipresente como en cierto modo desconocido: los datos.
"Llueven datos", resume Walter Sosa Escudero en su libro Big data (Siglo XXI). Entonces detalla el origen de la precipitación: celulares, páginas web, redes sociales, tarjetas de crédito, rastreadores satelitales, análisis clínicos. Nuestra sociedad decidió llamar big data a esa clase (particular pero diversa) y a ese volumen (autogenerado pero inasible) de información producida y enviada gracias a las interconexiones electrónicas. "En los últimos dos años, en todo el mundo hemos creado más datos que en toda la historia de la humanidad", revela el profesor de la Universidad de San Andrés.
"Piensen en lo que hicieron en las últimas dos horas", propone el biólogo Diego Golombek en el prólogo. Si caminamos con el celular o viajamos en auto, generamos información sobre el recorrido. Si salimos a correr con un smartwatch, se cuantifican pasos y ritmo cardíaco. También creamos datos cuando usamos la SUBE, ponemos like en Instagram o buscamos zapatillas en línea.
¿De qué está hecho este fenómeno? El consultor Doug Laney lo explicó en su fórmula de las tres V: volumen (por las altas cantidades de datos), velocidad (porque circulan en tiempo real) y variedad (son de generación espontánea y amorfos). "Anárquicos y espontáneos" son las otras dos características que enfatiza Sosa Escudero. "Los datos de big data no son más de lo mismo", aclara ante la consulta. A diferencia de los que generan un experimento o una encuesta (donde conocemos procedimientos, cantidad exacta de datos empleados y la relación con su población de referencia), estos "no obedecen a ningún plan sistemático; simplemente aparecen por interactuar con cosas que están interconectadas". Gracias a la nueva ciencia de datos, retoma Golombek, podemos crear mapas del cerebro basados en los billones de conexiones neuronales, planos del comportamiento criminal en las grandes ciudades y mejorar el manejo de crisis o catástrofes sobre la base de la información que se genera cuando millones de personas comparten sus opiniones.
Nuevos horizontes
Los datos, agrega Sosa Escudero, "iluminan aspectos que antes permanecían ocultos en términos de preferencias o emociones. El análisis del discurso de los tuits o de los comentarios en Facebook puede reflejar el humor social de una forma que no logra captar una encuesta". El big data también permite nuevos abordajes de cuestiones socioeconómicas: la medición de la pobreza con imágenes satelitales (haciendo un seguimiento de la construcción de barrios de emergencia) y de la inflación, con la técnica empresarial del web scraping, que obtiene los precios en forma directa mediante la navegación online.
El periodismo es otra de las áreas que puede enriquecerse con big data, mediante programas que automatizan información o encuentran relaciones entre miles de documentos. No solo es una tarea de programadores. Hacen falta especialistas con el temple y la energía para bucear en grandes volúmenes de información -a veces confusa, a veces aburrida- que revelen las historias ocultas. En este diario, LN Data (premiado este año como el mejor equipo en los Data Journalism Awards) apeló a esas dinámicas para producir un mapa multimedia de las escuchas del caso Nisman, un simulador de cuotas para créditos hipotecarios y un informe sobre la situación carcelaria argentina, con gráficos sobre alimentación, educación, trabajo, superpoblación, fugas y muertes. Además de valores como la visualización y la segmentación, estas técnicas habilitan investigaciones profundas e interacciones novedosas con periodistas, diseñadores y expertos en marketing.
Más allá de las alteraciones sísmicas en el modo en que la información se concibe, produce y consume, el big data está cambiando la vida cotidiana. Los ejemplos más evidentes son el auge de los sistemas de recomendación -qué serie mirar en Netflix o qué libro llevarse de Amazon de acuerdo a nuestras compras previas- y en los de posicionamiento geosatelital, como Waze o Google Maps, que reemplaza la incertidumbre del tráfico (cuánto se tarda en ir al centro en auto, cuál es el mejor camino, qué atascos conviene evitar) por la optimización de los recorridos.
A veces, la ciencia de datos puede tornarse inquietante, sobre todo en el diseño de perfiles digitales. Como cuando Walmart cruzó informes de ventas con pronósticos meteorológicos y descubrió que las ventas de Pop-Tarts se disparaban tras el alerta de un huracán: los clientes buscaban provisiones. Cada vez que el noticiero expandía un alerta, las sucursales ponían las galletas bien al frente. O cuando la cadena Target envió cupones de descuento para productos de bebé a una adolescente de Minneapolis que había comprado toallitas. El padre se enfureció con la empresa, pero pocos días después la chica tuvo que confesarle su embarazo.
Todo a la vista
En un artículo de mayo de este año para The Washington Post, el columnista de tecnología Geoffrey Fowler contó cómo -con él durmiendo a las tres de la mañana y la pantalla de su teléfono apagada- "las aplicaciones están transmitiendo un montón de información acerca de mí a compañías de las que nunca he oído hablar". Después de investigarlas, supo que esas apps usaban rastreadores de datos para enviar informes sobre la ubicación y el comportamiento de su teléfono a empresas de marketing, sitios de reseñas de restaurantes y servicios de alertas de seguridad. Además descubrió que lo rastreaban actores conocidos como Microsoft, Nike, Spotify... y The Washington Post. "Tenemos un gigantesco punto ciego cuando se trata de los datos que las compañías están investigando en nuestros teléfonos", escribió al borde de la resignación.
La conclusión es evidente. Estamos entregando demasiados datos, todo el tiempo. Sin saberlo, pero a voluntad. ¿Es el fin de la privacidad online? Sosa Escudero sale del laberinto por arriba: "Es un poco contradictorio estar online y pretender ser privado. Es uno de los riesgos que uno asume por el mero hecho de usar cosas interconectadas". También reconoce que hay cuestiones que deberían abordarse más temprano que tarde, como la creación de instituciones que ayuden a resolver los problemas de transparencia y ética que genera el flujo descontrolado de información. ¿Qué perfil deberían tener? ¿Estatales o empresariales? ¿Personales o de la sociedad civil? "Es un costado preocupante del big data", reconoce. "Tenemos que pensar cómo nos vamos a plantar respecto a este aluvión relacionado a cuestiones que nunca habíamos enfrentado como sociedad".
A esas instituciones nuevas, flexibles y necesariamente inteligentes les espera la misión titánica de entender y mejorar nuestra relación con los algoritmos: los métodos matemáticos y computacionales alimentados por big data. Lejos de la profecía apocalíptica de celebridades como Stephen Hawking y Elon Musk (convencidos de que, algún día, una inteligencia artificial avanzada podría prescindir de los humanos), Sosa Escudero asegura que -al menos por ahora- no tienen el poder absoluto que solemos concederles. "Les cuesta mucho predecir eventos complejos, como la fórmula Fernández-Fernández, la elección de Trump o lo que va a pasar en un partido de fútbol", ejemplifica. "Esa impredecibilidad tiene que ver con la interacción estratégica. Todavía hay costados de la realidad que son impredecibles, y el big data no puede hacer nada con eso".