Big data y algoritmos para luchar contra la discriminación
Todos recordamos la escena. Vivian Ward, el personaje de Julia Roberts en Mujer Bonita, entra con su desenfado y aspecto extremo a una carísima tienda de Rodeo Drive, y cuando pregunta "¿cuánto cuesta este vestido?", recibe como respuesta un "no tenemos nada para usted, obviamente está en el lugar equivocado; por favor, retírese". Todos nos indignamos con la discriminación basada en apariencias y luego celebramos ver a la Roberts retornar vengativamente al negocio, ya transformada en una Cenicienta moderna, con Roy Orbison cantando "Pretty Woman" de fondo. Hollywood jamás decepciona.
Pero la realidad es más dura y pocas veces ofrece oportunidades como las que tuvo el personaje de Julia Roberts. A fines de estudiar estas lamentables prácticas, big data y algoritmos mediante, el joven economista argentino Ignacio Sarmiento Barbieri integró un equipo que, a su manera, creó algo así como "clones" de las distintas versiones de Julia Roberts (la rea, la refinada, la inocente, etcétera) para estudiar las actitudes discriminatorias en la sociedad, en particular en contra de los negros y los latinos en Estados Unidos. Estas cuestiones ocupan un lugar central en la discusión política del país del norte, máxime con las tensiones raciales que atraviesan toda su historia.
El estudio que llevaron a cabo Sarmiento Barbieri junto a Peter Christensen (de la Universidad de Illinois) y Christopher Timmins (de Duke) se focalizó en la situación que enfrentan la comunidades afroamericanas y latinas en el mercado inmobiliario. La situación real es la siguiente: un latino o afroamericano va a una inmobiliaria a alquilar una vivienda, y solo por su aspecto físico es abiertamente discriminado, en forma no muy distinta de la narrada en el episodio de Mujer Bonita.
A fines de pasar de la anécdota a la hipótesis concreta y científicamente analizable, Sarmiento Barbieri y sus colegas crearon un bot (un robot computacional) que lee páginas web de ofertas de alquileres de inmobiliarias y responde haciéndose pasar por potenciales interesados, blancos, negros y latinos, creados al azar a través de un meticuloso diseño experimental. La forma de crear estos "inquilinos ficticios" es asignándoles un nombre que claramente indique la pertenencia a uno de estos grupos étnicos. Por ejemplo, un nombre como José Ramírez indica obviamente a un latino. Con los afroamericanos la cuestión es más complicada. El equipo utilizó los resultados de un puntilloso estudio reciente del sociólogo Michael Gaddis, de la Universidad de California en Los Ángeles (e implementado online en la plataforma Mechanical Turk, de Amazon), que muestra que nombres como Tanisha, Tremayne o Jamal son mucho más identificables con la comunidad afroamericana que Hunter, Claire o Seth, que indican fuertemente a los blancos. Más aún, Gaddis encuentra que una precisa combinación de nombres y apellidos permite no solo indicar pertenencia racial sino también a distintos grupos socioeconómicos, aun dentro de un mismo grupo étnico, lo que permite aislar cuestiones raciales de económicas.
Así, el bot (bautizado por sus creadores como "Earl", en homenaje al abogado Earl Dickerson, pionero en la lucha por los derechos habitacionales de los negros) fue entrenado para leer avisos online de oferta de alquileres y para responder manifestando interés en una vivienda, haciéndose pasar por Tanisha Booker, Seth Miller, Mirta Orozco o nombres similares, a través de un mensaje generado computacionalmente.
Los resultados son escandalosos. En los peores barrios (en particular, en aquellos con altísimos niveles de contaminación), aproximadamente el 60% de estos "inquilinos robóticos" recibió respuesta por parte de las inmobiliarias, sin mayores distinciones entre negros, blancos y latinos. Pero cuando se trata de las mejores zonas (aquellas con menores niveles de contaminación), la proporción de respuestas que reciben los "bots afroamericanos" se desploma al 23%, mientras que las de los blancos queda inalterada. Dicho de otra forma, en las mejores zonas, tal vez aquellas en las que deambulaban Julia Roberts y Richard Gere en Mujer Bonita, y más allá de sus ingresos y otras características, los afroamericanos deben visitar el triple de viviendas que los blancos, a fines de ser atendidos por las inmobiliarias. De manera esperable, el estudio encuentra que la situación de los latinos es también desventajosa, si bien no tanto como la que enfrentan los afroamericanos. Es importante remarcar que la naturaleza "robótica" y online de esta investigación les permite a los autores estudiar esta cuestión en todas las áreas importantes de los Estados Unidos, a diferencia de estudios anteriores, que, basados en cartas y con actores reales, solo se refirieron a regiones muy específicas.
Son varias las moralejas que deja este estudio. Los datos utilizados no provienen de ninguna encuesta sistemática sino de un uso inteligente de datos online, de la intervención de un robot inteligente que inicia la transacción en forma automática y de un mecanismo computacional que recibe y codifica las respuestas (y la ausencia de ellas). Dicho de otra forma, se trata de datos "de big data", no tanto por su masividad sino por su libre disponibilidad, producto de "chupar" datos disponibles en línea.
La euforia por introducir elementos de big data o machine learning en las disciplinas sociales halló un terreno fértil en circunstancias fundamentalmente descriptivas o clasificatorias, y desde una perspectiva claramente inductiva. El estudio implementado por Sarmiento Barbieri y sus coautores sugiere el inicio de una interesante etapa evolutiva del uso de big data, ahora para estudiar fenómenos complejos, por sobre meras descripciones, clasificaciones y predicciones muchas veces triviales.
Otra característica llamativa de esta investigación es la conformación del equipo que la llevó a cabo, que demanda habilidades marcadamente multidisciplinares, que en el caso del estudio relatado requiere conocimientos del mercado inmobiliario, cuestiones ambientales y geográficas, delicados asuntos relacionados con la sociología y la cultura y, obviamente, habilidades computacionales y numéricas de frontera. Ignacio Sarmiento Barbieri (actualmente profesor de la Universidad de Los Andes, en Bogotá) es un claro exponente de esta nueva generación de "economistas polifuncionales". Formado inicialmente en economía (en las universidades nacionales de Tucumán y La Plata), continuó sus estudios doctorales en economía y estadística matemática en los Estados Unidos, para luego realizar una instancia posdoctoral en el prestigioso National Center for Supercomputing Applications de la Universidad de Illinois, institución de frontera en tecnologías digitales aplicadas a la física, la medicina, la agronomía y, recientemente, a la economía o la ciencia política.
Es motivo de celebración este uso inteligente de big data y algoritmos para estudiar fenómenos complejos, que más que describir y encontrar patrones en los datos, intenta evaluar y cuantificar hipótesis concretas acerca de problemas urgentes de la sociedad.
Cabe preguntarse cuán lejos está la tecnología de crear robots reales, cual hologramas de Julia Roberts o los inquilinos buscando departamentos, a fines de estudiar profundamente estas cuestiones. Y también vale pensar en la "meta pregunta" de si será posible diseñar un robot que, a su vez, reemplace a Sarmiento Barbieri y a los coautores en la formulación de preguntas interesantes y en el diseño de respuestas apropiadas. Por ahora, la respuesta parece lejana, a la luz de la naturaleza disruptiva y creativa de los humanos, que todavía tienen una ventaja difícil de imitar.
Temas
Otras noticias de Tecnología
- 1
Plazo fijo: cuál es la tasa de interés banco por banco este lunes 23 de diciembre
- 2
Fernando Marengo: “Los argentinos tenemos que decidir si estamos dispuestos a vivir sin inflación”
- 3
Primero en el mundo: un orégano con alta concentración de aceites esenciales quedó a un paso de un sello único
- 4
Real hoy: a cuánto cotiza la moneda brasilera oficial y blue este lunes 23 de diciembre