Un nuevo asistente llega a WhatsApp: entre sus funciones permite transcribir audios sin cargo, algo que ya era posible con Luzia y Transcribeme, que ahora requieren instalar una app; también sirve como chatbot al estilo ChatGPT para hacerle consultas de todo tipo
- 6 minutos de lectura'
Uno de los mejores frutos de las herramientas con inteligencia artificial es el transcriptor de audios de WhatsApp: ese contacto conocido como chatbot al que le reenviás un mensaje de audio, y que te transcribe en la misma conversación. Útil para cuando no podemos escuchar un mensaje y también, para cuando queremos desgrabar un testimonio, entrevista o mismo tener una dirección escrita. Los más conocidos son TranscribeMe (hecho en nuestro país; tiene una versión gratis y otra paga, más sofisticada) y Luzia, creado en España (antes era un contacto en WhatsApp; ahora requiere instalar una app).
Una empresa con gen latino acaba de presentar otro bot gratuito que tiene la misma funcionalidad, pero con cualidades distintivas al resto, ya que además brinda información localizada. Se llama Zapia, funciona dentro de WhatsApp (es decir, lo tendremos disponible como un contacto más), y puede transcribir audios, interpretar y enviar imágenes, buscar datos en internet y otras funciones.
“Zapia es un producto que está enfocado y optimizado para América Latina. Tiene mejor información localizada que cualquier otro chatbot de AI porque es un producto que desde el primer momento está diseñado para ayudar a los latinoamericanos a automatizar sus compras, reservas, negociaciones y trámites” dicen a LA NACION sus desarrolladores, y aclaran que algunas de estas funcionalidades aún están en desarrollo, pero el chatbot ya está disponible para su uso abierto y gratuito (en el sitio oficial un botón permite sumarlo como contacto para comentar a dialogar con él).
Una de las propuestas distintivas del bot es que ofrece información relacionada con comercios de cercanía. Por ejemplo, se le puede preguntar dónde comprar medialunas, y la respuesta variará según la ubicación del usuario, que tendrá, además, la posibilidad de contactar al comercio desde un botón. Para esto debemos permitirle acceder a nuestra ubicación.
El distintivo es que, en Zapia, también trabajan humanos: “El sistema combina varios modelos de inteligencia artificial (dependiendo de la tarea) con asistentes humanos que ayudan a la AI a encontrar la solución a tareas de los usuarios”, aclaran Juan Pablo Pereira, cofundador de Zapia AI de BrianLogic, la empresa que empezó a gestar el bot desde hace menos de un año. La compañía tiene sedes en Uruguay y Silicon Valley, y acaba de anunciar que ya llegaron al millón de usuarios desde que abrieron la beta del bot.
Además de WhatsApp y Facebook Messenger, Zapia está disponible en sus propias apps de Android y iPhone, que tienen funcionalidades extendidas con respecto al mensajero de Meta.
¿Qué se puede hacer con Zapia?
- Transcribir audios reenviados y cargados
- Pedirle alguna imagen
- Buscar comercios por cercanía
- Pedirle información general, consultar noticias, ayuda en tareas y estudio (algo útil para los usuarios que en su plan móvil tienen WhatsApp ilimitado, pero se quedaron sin datos en el abono)
- Interpretar fotos (por ejemplo, decir qué modelo es un tipo de calzado)
Los antecedentes: el primero te lo regalan
El primer chabot que permitió en lengua castellana transcribir audios de manera gratuita y automática fue TranscribeMe, pero meses después, pasó a ser un producto de pago, con precios accesibles (mantiene una versión gratis, pero bastante limitada). El segundo fue LuzIA, un sistema español que funcionaba como un bot conversacional al que se le podía pedir que transcriba audios reenviados. En la actualidad, no funciona más en WhatsApp, es solo una aplicación y no permite cargar audios. El tercero fue Carina, muy similar a Luzia. Por ahora no está funcionando.
Ninguno de estos chatbots son propiedad de Meta, sino de empresas privadas que cuentan con sus propios términos y condiciones para funcionar. La compañía propietaria de Facebook sí está desarrollando su propio chabot llamado Meta AI para estas funciones (incluyendo la transcripción de audios) y por ahora solo funciona en la beta de WhatsApp.
Algo muy importante con respecto a estos sistemas es que les estamos entregando información todo el tiempo: voz, datos y contexto. Por eso es importante no solo leer las políticas de privacidad y seguridad, sino también conocer qué empresa está detrás.
“La tecnología de Zapia está basada en los sistemas de Inteligencia Artificial generados de OpenAI, Google y Anthropic, que son mejorados con datos que desarrollamos en Zapia, y además los usuarios pueden usar las reacciones en WhatsApp para decirnos qué cosas funcionan y qué tienen que mejorar, y eso lo usamos para refinar los modelos”, describen desde la empresa y explican que el sistema está optimizado con información de América Latina generada por el equipo de Zapia y tiene acceso a fuentes de datos en tiempo real, desde noticias, información local, direcciones, pronóstico de tiempo, resultados deportivos, etc.
Cómo funcionó cuando lo probamos
Desde LA NACION probamos diferentes comandos. La transcripción anda muy bien; pero la búsqueda de imágenes y de datos aún devuelve algunos errores: funciona bien si le pedimos una foto de Leo Messi tomando mate, funciona erráticamente si le pedimos la misma foto de otra persona no tan famosa, porque toma fotos que quizás no corresponden con la persona. Lo mismo sucede al pedirle datos sobre un suceso o una personalidad: puede estar correcta, actualizada y con links de referencias, o puede tomar información vieja y entregarla como actual (en una ocasión nos dijo que el último Mundial de Fútbol lo había ganado Francia en 2018; en otra consulta respondió, correctamente, valorando la victoria argentina en el Mundial de Qatar). Pero también pudo decirnos si iba a llover el fin de semana, y nos dio una síntesis y unos enlaces de referencia para entender el paro de ATE de la semana próxima. Las inconsistencias surgen, suponemos, dependiendo de a qué herramienta le delega la búsqueda de una respuesta a cierto tipo de consultas.
El sistema de BrainLogic está en desarrollo y continúan trabajando en nuevas funcionalidades enfocadas en el usuario que vive en Latinoamérica: “Actualmente, está en desarrollo la herramienta que permite a los usuarios automatizar sus comunicaciones con comercios a través de WhatsApp para realizar compras, reservas, negociaciones y trámites. Porque a diferencia de los países desarrollados donde todo se puede hacer online, en América latina todo se hace en WhatsApp”.
Este emprendimiento tecnológico fue fundado por los emprendedores latinoamericanos Martín Alcalá Rubí, Nicolás Loeff, Juan Pablo Pereira, Juan Olloniego y Pablo Rodríguez-Bocca. Si bien la operativa de Zapia está enfocada en países como Brasil, México, Colombia, Argentina, Perú y Uruguay, poseen usuarios de más de 30 países. Su modelo de negocio está basado en la intermediación de comercio similar a como genera sus ingresos una plataforma de e-commerce.