Adobe mostró VoCo, el Photoshop de la voz
Puede generar palabras nuevas y crear una frase que una persona nunca dijo, con su misma voz y entonación; es tan sencillo como escribir el texto de lo que la computadora le hará decir
En la reciente Adobe Max Creativity Conference, Adobe presentó su proyecto VoCo: una herramienta de edición de audio que permite crear palabras nuevas para una voz: la compañía dice que con 20 minutos de audio de una voz, el software puede hacerle decir cualquier cosa, con algo tan sencillo como tipear la frase querida. La generación del audio apócrifo es casi instantánea; busca las palabras en el audio indexado o genera nuevas, tomando los fonemos y cambiando la entonación para que encajen con el resto del audio.
Por supuesto, y al igual que con el Photoshop, esto habilita desde lo gracioso (hacerle decir a un amigo que está enamorado de su perro) hasta lo problemático (poner en un político palabras que no sean las suyas, difundirlo, etcétera), con el agravante de que la edición del audio inventado (que genera inflexiones y entonaciones para que el audio sea natural) parece ser -al menos en la demo- más sencilla que la generación de una imagen falsa.
Adobe dice que tomó la experiencia de retoque digital que habilitó el Photoshop y busca evitarlo con VoCo, sumando una suerte de firma digital al audio generado, de tal manera que sea reconocible. No está claro exactamente cómo lo hace, no obstante.
El software todavía no está disponible, pero se suma a otros desarrollos (como la trasposición de la expresión en el rostro de dos personas en tiempo real) que están eliminando la posibilidad de distinguir entre lo real y lo inventado.
La presentación (en inglés) de VoCo