Con dos segundos de audio, Voicebox puede sintetizar una voz casi indistinguible de la humana original; Meta la imagina para asistentes digitales y personajes del metaverso, pero por temor a que se use para deepfakes por ahora no permitirá su uso indiscriminado
- 2 minutos de lectura'
Meta ha presentado Voicebox, un nuevo modelo de inteligencia artificial (IA) con capacidad para realizar tareas de generación del lenguaje, incluso aquellas para las que no ha sido entrenado con un aprendizaje contextualizado.
Voicebox es el primer paso para una herramienta que pueda dotar de voz natural a los asistentes virtuales y a los personajes no jugables del metaverso, pero también para ayudar a las personas invidentes a oír los mensajes que reciben.
La compañía tecnológica considera que se trata de “un gran avance” en la IA generativa para lenguaje, dado que este modelo puede realizar tareas como editar, crear muestras y estilizar, e incluso aquellas para las que no fue entrenado específicamente mediante aprendizaje contextualizado.
Voicebox puede producir clips de audio de alta calidad a partir de una muestra de dos segundos, y editar audio pregrabado para recuperar en él la voz entrecortada por un ruido ambiente, como el ladrido de un perro.
Meta también ha destacado que se trata de un modelo multilingüe, lo que permite la producción de voz en seis idiomas (inglés, francés, alemán, español, polaco o portugués), según recoge en su blog oficial.
Para el entrenamiento Voicebox, los investigadores de Meta han empleado más de 50.000 horas de grabaciones de audio y transcripciones procedentes de audiolibros de dominio gratuito en los seis idiomas mencionados.
“Hay muchos casos de uso emocionantes para los modelos de habla generativa -admiten los investigadores de Meta-, pero debido a los posibles riesgos de uso indebido, no estamos poniendo a disposición del público el código o el modelo de Voicebox en este momento. Si bien creemos que es importante ser abiertos con la comunidad de IA y compartir nuestra investigación para avanzar en el estado del arte en IA, también es necesario lograr el equilibrio adecuado entre la apertura y la responsabilidad.”
Europa PressOtras noticias de Inteligencia artificial
Más leídas de Tecnología
Clave. Los trucos de WhatsApp más simples y prácticos que son fáciles de aplicar
Infancias. Cómo activar el "modo Peter Pan" en WhatsApp
Similares a los Ray-ban de Meta. Samsung tendrá su línea de anteojos inteligentes en 2025
Cuidado. Qué significa quitar la foto de perfil en WhatsApp, según un psicólogo