Una herramienta llamada Heygen permite doblar el audio a cualquier idioma, pero manteniendo el tono de voz original; se usó con Leo Messi hace unos meses
- 2 minutos de lectura'
Ayer miércoles, el presidente Javier Milei dio un discurso en Davos, en su primera participación en el Foro Económico Internacional como Presidente. Frente a políticos y empresarios, Milei hizo una fuerte defensa del capitalismo y advirtió que Occidente “está en peligro”, además de cargar contra el socialismo, al que consideró un “un modelo empobrecedor que fracasó”. Sus declaraciones sorprendieron a muchos de los presentes; en algunos casos para mal, en otros para bien: Elon Musk elogió su discurso, por ejemplo.
Javier Milei dio su discurso en español, pero en redes se hizo viral una versión en la que habla en perfecto inglés, con su propia voz. No es una segunda grabación del discurso, ni un doblaje de un imitador: más bien, se trata de una reconversión del audio que hace una plataforma de inteligencia artificial, capaz de tomar el video, generar un audio nuevo en otro idioma, mantener el tono y timbre de voz, y ajustar la cadencia del audio y los movimientos de la boca de la persona en cámara para hacerlo más verosímil. La herramienta más conocida es Heygen, pero hay otras.
Es la misma técnica que se usó en septiembre último para generar un video en el que Lionel Messi, famoso por hablar en español con acento rosarino en cualquier situación en la que se encuentre, habla en forma fluida en inglés durante una conferencia de prensa.
HeyGen no es la única herramienta disponible: tal como contamos en esta nota, hay otra similar, Rask, que permite lograr este doblaje con inteligencia artificial, manteniendo la voz de cada persona en el video y permitiendo que “hablen” en un idioma que no manejan.
El doblaje por inteligencia artificial ofrece un potencial enorme para distribuir un mismo video, con la misma persona en cámara, pero hablando en diferentes idiomas, eliminando la necesidad del subtitulado y manteniendo las características sonoras de la persona que habla; por ahora, no obstante, no logra capturar el tono de la alocución, algo que sí pueden reproducir los doblajistas humanos.
A la vez, la evolución de este tipo de herramientas representa un problema para los doblajistas, tal como relató el locutor Alejandro Graue hace unos meses, cuando contó que había dejado de ser la voz en español de un reconocido youtuber, porque estaban usando una versión sintética en español de la voz original.
LA NACIONOtras noticias de Inteligencia artificial
Más leídas de Tecnología
Clave. Los trucos de WhatsApp más simples y prácticos que son fáciles de aplicar
Infancias. Cómo activar el "modo Peter Pan" en WhatsApp
Similares a los Ray-ban de Meta. Samsung tendrá su línea de anteojos inteligentes en 2025
Cuidado. Qué significa quitar la foto de perfil en WhatsApp, según un psicólogo