Tres investigadores suizos mostraron cómo pueden entrenar un motor de inteligencia artificial sencillo para reconocer todas las fotos con cierta característica en la clásica prueba antispam de Google
- 4 minutos de lectura'
Son una molestia: esas barreras digitales en las que un sitio intenta determinar si somos una persona o un robot, y para ello nos muestra una serie de imágenes en un damero y nos pide que marquemos las que tienen semáforos, sendas peatonales, motocicletas, bicicletas o colectivos. A veces es una pavada trivial de dos segundos, a veces se empeña en castigarnos con rondas interminables de selección de fotos; sea porque erramos en alguna, o porque una foto tiene un pixel que el sistema decidió que corresponde a eso que nos pide identificar, que nosotros jamás veremos, y que como no lo marcamos, desconfía.
Ese sistema se llama reCaptcha v2, y está diseñado para frenar el acceso de los bots (programas automatizados) a un servicio digital. La premisa, cuando fue creado hace casi una década, era que para una computadora identificar esos objetos en las imágenes era muy complicado, y por lo tanto constituía una barrera que únicamente los humanos podían superar.
Ya no: Andreas Plesner, Tobias Vontobel y Roger Watternhofer, del ETH Zurich, demostraron cómo pueden usar un motor de inteligencia artificial sencillo capaz de reconocer las imágenes de los Captchas con 100% de efectividad. Los investigadores encontraron que incluso si no acertaba en la primera tanda de imágenes (algo que también les sucede a veces a los humanos) sumaba suficientes puntos en las tandas siguientes como para ser validado por el sistema como una persona. Y notaron que son solamente 13 categorías de objetos que componen esta versión de los Captchas.
La noticia tiene un sabor agridulce: por un lado, porque esto significa que un sistema que se venía usando para evitar que algunos programas abusen de servicios digitales (para buscar información en forma masiva y saturar los sistemas, para dejar comentarios publicitarios automatizados en foros, para iniciar procesos de compraventa a una velocidad superior a la de las personas) perdió su eficacia; pero, por otro lado, para los sufridos humanos, la buena noticia es que su uso declinará en favor de otros sistemas más modernos de identificación de personas.
Uno es, claro, la versión más reciente de reCaptcha, que solo muestra un botón de “no soy un robot”, pero cuyo funcionamiento es invisible para las personas, y que apela a la medición en segundo plano de ciertas acciones que hacemos con la computadora (como el movimiento del ratón, el scrolll de la pantalla y más) para determinar si somos una persona o un robot. Pero incluso reCaptcha v3, la más reciente versión de este sistema, tiene 5 años de edad... y ya fue vulnerada. “Con reCaptcha v3, evoluciona el modo en que los sitios comprueban si se trata de un usuario humano o de un robot, puntuando cada interacción según lo sospechosa que parece y, de esta forma, eliminando la necesidad de interrumpir la experiencia de los usuarios con pruebas”, explican en Google.
Cómo nacieron los Captcha
Captcha son las siglas de Completely Automated Public Turing test to tell Computers and Humans Apart (test de Turing público y automático para distinguir a las computadoras de los humanos). La primera versión, creada por Luis Von Ahn (el fundador de Duolingo) era más sencilla (identificar una palabra que se veía deformada en una imagen) y tenía un doble propósito colaborativo, frenar el spam en todas sus formas y lograr que los usuarios ayudaran a los proyectos de digitalización de textos que usaban software de reconocimiento de letras y caracteres (OCR). A esa versión le siguió otra, en la que había que identificar letras y números en una imagen que estaba “ensuciada” por trazos de todo tipo (y que la inteligencia artificial también es capaz de reconocer); y luego llegó la de la grilla de imágenes, que ahora sabemos no es infalible.
¿Estamos perdidos, entonces? No, pero está claro que el juego del gato y el ratón que se viene dando en las últimas décadas para frenar al spam y otros servicios que buscan hacerse pasar por personas para armar campañas masivas en sitios de competidores, o estrategias similares, están acá para quedarse.
LA NACION