Cómo es el sistema que le permitirá hablar con su propia voz al exdiputado y exfuncionario Jorge Rivas, que quedó cuadripléjico tras un asalto en 2007
Un desarrollo local permitirá reemplazar el sistema que usa Rivas hoy, que aplica una voz robotizada, por otro que usará su propia voz, lograda a partir de registros y discursos históricos
- 5 minutos de lectura'
Un desarrollo de software de voz sintética que cuenta con la utilización del registro de voz histórica del usuario, “para mejorar las condiciones de accesibilidad universal y de calidad de vida, tanto en el desempeño de sus funciones sociales, como en su vida privada, de personas con afecciones en el habla”. De eso se trata el proyecto que miembros de varias universidades presentaron junto al Ministerio de Ciencia y Tecnología, y que posibilitará que Jorge Rivas, exdiputado nacional y quien mientras era vicejefe de gabinete de la Nación en 2007 sufrió un violento asalto que lo dejó cuadripléjico y privado del habla, aunque con su capacidad intelectual intacta, pueda comunicarse con su voz original, y no con la de un robot.
El sistema tiene dos partes constitutivas. Una parte le permite a Rivas traducir el movimiento de sus pupilas en el desplazamiento en una pantalla de un cursor sobre un teclado digital, lo que le permite escribir palabras, letra por letra.
La otra parte consiste en un módulo de inteligencia artificial comúnmente conocido como “texto a voz”. Este módulo se ocupa de convertir el texto generado por la etapa anterior en audio. La clave del proyecto es que el audio generado se parezca lo más posible a la voz de Jorge Rivas, actual miembro de la Dirección Nacional de Estrategias Inclusivas, Accesibles y de Desarrollo Sostenible del Ministerio de Transporte.
Al día de hoy, señalan, Rivas “está utilizando un sistema que logra este proceso, pero con muchas limitaciones de usabilidad y generando una voz “robotizada”. “En este proyecto nos estamos ocupando del módulo de IA. Sin embargo, la cadena para traducir el movimiento de las pupilas en audio que hoy está utilizando está compuesta de 4 o 5 etapas de software distintas y no tiene las prestaciones que podría tener con el actual estado del arte. El objetivo a mediano plazo es integrar todo en un solo software que interactúe con el hardware, conformando una plataforma intuitiva, práctica y fácil de usar. Para ello es que sería interesante disponer de una línea de financiamiento que le dé continuidad al desarrollo”, explican los gestores del proyecto.
Mi Identidad Vocal arrancó en 2019, pero la pandemia provocó un impasse que fue retomado en 2022, y ahora es parte del desafío ImpaCT.AR, un programa que tiene el propósito de promover proyectos de investigación y desarrollo destinados a brindar apoyo a organismos públicos en la búsqueda de soluciones a desafíos de interés público.
Ir más allá
El propio Rivas manifestó su emoción. “Es el primer software de esta naturaleza que se realiza en nuestro país, y que será de acceso universal. Es decir, que podrá acceder a él, quien lo necesite….. De allí la importancia de universalizar el acceso a estos derechos, a todas las personas sin voz. Ya que hoy somos minoría, los que accedemos a estos derechos. Por eso debemos exigir inversión pública y privada en estos proyectos de investigación inclusiva”. A su lado, en la presentación, estaba Daniel Filmus, ministro de Ciencia y Tecnología, quien señaló que este proyecto “se lo envié el proyecto a Esteban Bullrich, con quien estamos desarrollando varios proyectos de inclusión e investigación a través de su fundación, y estaba muy contento y agradecido, y quedamos en seguir trabajando juntos en este tema, porque hay un campo de necesidades muy importante”.
“Estamos en la mitad del proceso y muy contentos con los resultados obtenidos. Faltan aún, cuatro meses”, señalan los desarrolladores. La idea -especifican- es que sea open source, y que esté a disposición de quien lo necesite de forma gratuita. Sin embargo, la plataforma requerirá ajustes para cada persona en particular, así como también mantenimiento y mejora continua si se tiene en cuenta el ciclo de vida del software. “Es nuestra intención poder brindar este soporte para que el usuario final realmente lo pueda utilizar”.
Según señalaron, el costo final presupuestado fue de $ 9.617.000. “Sin embargo, las varias etapas que suponen este prototipo hasta poder ser considerado un producto final, requerirán de mayor financiamiento. Por eso, y como ya hemos mencionado, consideramos que sería una buena política de estado disponer de una línea de financiamiento sostenido para que estos proyectos puedan tener continuidad e impacto a mediano y largo plazo”.
Participaron del mismo desde la UTN-Facultad Regional La Plata, Centro UTN CODAPLI - Sistemas Aplicados a Neurotecnologías y junto a la Facultad de Ingeniería del Ejército (FIE -UNDEF) y Laboratorio de Mecatrónica “Infiniem Labs”. Y el equipo lo conformaron por la UTN FRLP la Licenciada Andrea Cortizo (Fonoaudiología y Análisis de Sistemas), la Dra. Silvia Vega (Fonoaudiología), los ingenieros José Rapallini (electrónica), Gerardo Leskiw, Gerardo (Sistemas de Información) y Hernán San Martín (Especialista en Sistemas de Control). Por la Facultad de Ingeniería del Ejército - UNDEF, los ingenieros Maximiliano Yommi (Ingeniero en Sonido) y Eduardo Sacerdoti (Ingeniero en Sonido), Iván Pupkin, Nahuel Passano, Paula Ortega Riera, Darío Paez y Franco Bach (Estudiantes de Ingeniería en Sonido)