Luis Von Ahn: el inventor silencioso
Descubrió cómo evitar el spam, creó un juego que ayuda a Google a refinar su galería de imágenes y ahora va por el primer traductor online hecho por humanos
Una i. Es una i. A ver..., no; es una l. ¡Pero sí!, mirá la altura: es una l de acá a la China. Luego a, g..., ¿g? Todos los días tipeamos, al menos, un Captcha, esa cajita con caracteres de dudosa estilización que darán el permiso para continuar navegando en Internet cuando el sistema sepa que no es un robot quien intenta hacerlo (sólo los humanos son capaces de comprender y descifrar la secuencia). Más fácil, entender las siglas de Captcha: Completely Automated Public Turing Test to Tell Computers and Humans Apart. Sí, así se llama lo que te impacienta y hace pensar en quién habrá sido el perverso que no piensa en tu tiempo.
Tenemos al malo. Se llama Luis Von Ahn, guatemalteco con residencia en Estados Unidos, científico y profesor en Ciencias de la Computación. Su tesis de doctorado se tituló Computación basada en humanos. Miedo, ¿no? Tiene una sonrisa permanente. Cuesta desentrañar si es nerviosa o si la genética le puso más fichas a la alegría.
–¿Cómo fue el proceso de invención del Captcha?
–Yahoo tenía un problema: había muchas personas que escribían programas para obtener millones de cuentas de correo electrónico gratis. Cualquiera puede tener una cuenta, pero no obtener millones. Nos pidieron ayuda y ahí surgió la idea del Captcha, una manera de distinguir si es un humano o una computadora, porque los humanos no pueden crear un millón de cuentas.
–Lo diste gratis, a los 21 años (tiene 33). ¿Por qué?
–No sé [se ríe]. Y no sé cuántos millones de sitios lo usan.
–¿Pensás que los generadores de spam te odian?
–Espero que sí.
–Pensemos como en el cine, héroes y villanos, científicos buenos y de los no tanto. ¿Te pidieron tu cerebro para algo non sancto?
–Sí, me han buscado. Han ofrecido hasta 50 mil dólares para que desarrollara programas que resolviesen mis propios Captchas. Cada vez que alguien debe escribir esas letritas pierde 10 segundos; al multiplicarlo por 200 millones (cantidad de letras resueltas por día en el mundo) significa que la humanidad desperdicia alrededor de 500 mil horas diarias por mi culpa.
–¿Esa culpa te llevó a qué?
–Me llevó a pensar: ¿será que existe una manera de utilizar este tiempo y esfuerzo para el bien de la humanidad? Durante los 10 segundos que el usuario está ingresando un Captcha su cerebro está haciendo algo increíble, algo que las computadoras aún no pueden hacer. Y resulta ser que sí podemos reutilizar ese esfuerzo para algo muy beneficioso: hoy, cuando alguien escribe esas letritas, no solamente está demostrando que es un humano, también está ayudando a digitalizar libros. Las palabras en esas letritas vienen de libros que han sido escaneados, pero que la computadora no puede descifrar, y usamos las respuestas de los usuarios para poder digitalizar los libros.
Habla de Recaptcha (vendida a Google en 2009). No veremos una, sino dos palabras. La primera es la que el sistema conoce (y nos valida como humanos), la segunda pertenece a ese grupo de ilegibles de los escaneos. Según los cálculos de Von Ahn, estamos ayudando a digitalizar 100 millones de palabras diarias, es decir, dos millones de libros al año.
La discusión por la cantidad de horas de navegación –en muchos casos, naufragio– está en la mesa. Se dice que estamos creando –¿criando?– expertos en nada. Preguntarse qué hay con la pérdida del tiempo y si es la esposa de lo improductivo, puede responderse con una depresión profunda. Von Ahn estima que en Estados Unidos una persona dedica tres horas por día a redes sociales o YouTube. En 2003, por ejemplo, los usuarios habrían pasado 9 millones de horas jugando solitario en la computadora. El Empire State se construyó en 7 millones de horas. Von Ahn, además de deprimirnos por mostrarnos cuán idiotas nos ponemos, se dedica a ver cómo hacer que ese tiempo sirva.
Por ejemplo, el dilema de los traductores automáticos. Tenemos el caso de la página oficial de un conductor de televisión argentino, Hernán Caire, en la que cita a Cris Morena como Cris Dark y al programa de televisión Jugate conmigo como You play you with me.
–Inventaste Duolingo ( www.duolingo.com ), ¿pretende ser como una Wikipedia de la traducción?
–Algo así. Queremos traducir todo el contenido de Internet. En Duolingo la gente va a poder aprender un idioma gratis. Y mientras están aprendiendo, están traduciendo. Ellos traducen las frases y pueden ver cómo las tradujeron otras personas. Y después de hacer eso empiezan a aprender, y a medida que lo hacen les damos oraciones más complejas.
La apuesta es fuerte y busca equilibrar la balanza: sólo el 20% de los contenidos de Wikipedia en inglés está disponible en español, para dar una idea. Otro número: "Con 100 mil usuarios activos podríamos traducir todo Wikipedia del inglés al español en 5 semanas. Con un millón de usuarios podríamos hacerlo en 80 horas", explica.
–Si juego al ESP Game, ¿qué estoy haciendo?
–Ayudando a mejorar la búsqueda de imágenes en Google. Las computadoras aún no pueden descifrar el contenido de una imagen en Internet, así que la búsqueda de imágenes en el pasado funcionaba sobre la base de nombres de archivo. Si buscabas imágenes de perros, retornaban imágenes cuyo nombre de archivo era "perro.jpg". Obviamente, ese método antiguo no podía funcionar muy bien ya que cualquiera puede nombrar su imagen "perro.jpg" aunque no contenga un perro. Con el ESP Game, los jugadores (no tienen contacto entre sí y deben coincidir en la respuesta) dicen qué está en cada imagen de Internet y así mejoran los resultados de búsqueda.
–¿Qué es lo que no sabés hacer que te daría vergüenza que sepamos y que nos vas a contar ahora?
–Cuando compré mi auto, 0 km, al tiempo no arrancaba. Llamé, hice la queja, lo vieron y me sugirieron echarle gasolina cada tanto.
–ESP Game, Duolingo, Captcha, ¿nos estás usando para hacernos mejor, Luis? ¿Cuántos empleados somos?
–Se ríe y contesta sólo con una mirada cómplice que devuelve el chiste. Como Google, que te pega un golpe en la cara y la autoestima con su nombre y notas como 10 mejores científicos o los 50 mejores cerebros de la ciencia. Googlear. Ay. A esta altura hablar de Google trae esa sensación de estar desnudo en la calle. La indefensión.
Le estamos dando sentido a manchas de tinta, a eslabones ilegibles de grandes obras literarias. Le ponemos nombre a imágenes para que cuando un desconocido busque pileta le devuelva fotos de piscinas y no de un ombligo. Nos metemos en Duolingo para mejorar nuestro inglés y ayudamos a que Wikipedia sea más justa. La colaboración desinteresada por desconocimiento. El poder del crowdsourcing, liderado por un cerebro. Von Ahn es nuestro jefe. Creo que nos está mirando.
Acceda a la charla de Luis Von Ahn en TEDxRíodelaPlata