Google I/O 2019: Euphonia es uno de los proyectos más ambiciosos y de enorme impacto social en Google
En el Google I/O 2019 , su encuentro anual de desarrolladores, la compañía presentó teléfonos nuevos, anunció cambios al secretario Assistant y adelantó las novedades de Android 10 Q, pero también mostró los avances en Euphonia, uno de los servicio más interesantes de los últimos tiempos (eufonía significa "buen sonido" en referencia a la combinación de audio en forma agradable).
De lo que se trata es de volcar todo el poderío del motor de reconocimiento de voz que desarrolló la compañía, y que ahora es tan compacto que puede vivir en el teléfono y no depender de una conexión a Internet.
Primero, porque con Live Relay permite subtitular, en forma automática, cualquier video, sin preparación previa. Ideal para personas con problemas auditivos, pero también para ver las publicaciones en Instagram sin sonido en el subte, una receta, etcétera. Esto también sirve para "desgrabar" cualquier conversación; Microsoft mostró una tecnología similar el lunes durante su conferencia BUILD 2019.
We'll consider it a draw in this dev rap battle. #MSBuildpic.twitter.com/kFTeglyYCc&— Microsoft (@Microsoft) 6 de mayo de 2019
Pero la tecnología de Google va un poco más allá, como mostró en un video muy emotivo: su motor de aprendizaje es capaz de entender lo que dice una persona con problemas para hablar producto de un ACV o alguna otra enfermedad degenerativa como esclerosis múltiple.
Lo que Google está haciendo es pedirle a gente de todo el mundo que les envíe sus audios para que sus sistemas aprendan de esas verbalizaciones. Como sabe cualquiera que haya usado un sistema de reconocimiento de voz, el patrón base es una palabra bien pronunciada; en el caso de personas con dificultades en la dicción, esto hace imposible interactuar con la voz con una computadora.
Pero si los sistemas de Google aprenden a reconocer instrucciones con una pronunciación deficiente sería un cambio enorme para estas personas, sobre todo aquellas que están paralizadas pero mantienen cierto control sobre la voz, porque abriría un camino de comunicación fundamental, sobre todo si luego se combina con el motor de texto-a-voz de Google; en la demo que mostraron en la conferencia, podrían incluso mantener una conversación telefónica con la computadora como intermediario.
Ambas tecnologías, no obstante, están en fase de prototipo por ahora.
To help people make phone calls without having to speak or listen, Live Relay uses on-device speech recognition and text-to-speech conversion, allowing a phone to listen and speak on someone's behalf [R] https://t.co/6B0X1cF0JT#io19pic.twitter.com/sqeEUzZY2E&— Google (@Google) 7 de mayo de 2019