Meta dice que Voicebox, su nuevo sintetizador de voz que casi no necesita entrenamiento, es tan bueno que no lo puede liberar al público

Con dos segundos de audio, Voicebox puede sintetizar una voz casi indistinguible de la humana original; Meta la imagina para asistentes digitales y personajes del metaverso, pero por temor a que se use para deepfakes por ahora no permitirá su uso indiscriminado

21 de junio de 2023
13:58
2 minutos de lectura'

Actualizado el 13 de septiembre de 2024

Con dos segundos de audio, Voicebox puede sintetizar una voz casi indistinguible de la humana original; Meta la imagina para asistentes digitales y personajes del metaverso, pero por temor a que se use para deepfakes por ahora no permitirá su uso indiscriminadoShutterstock - Shutterstock

Meta ha presentado Voicebox, un nuevo modelo de inteligencia artificial (IA) con capacidad para realizar tareas de generación del lenguaje, incluso aquellas para las que no ha sido entrenado con un aprendizaje contextualizado.

Voicebox es el primer paso para una herramienta que pueda dotar de voz natural a los asistentes virtuales y a los personajes no jugables del metaverso, pero también para ayudar a las personas invidentes a oír los mensajes que reciben.

La compañía tecnológica considera que se trata de “un gran avance” en la IA generativa para lenguaje, dado que este modelo puede realizar tareas como editar, crear muestras y estilizar, e incluso aquellas para las que no fue entrenado específicamente mediante aprendizaje contextualizado.

Voicebox puede producir clips de audio de alta calidad a partir de una muestra de dos segundos, y editar audio pregrabado para recuperar en él la voz entrecortada por un ruido ambiente, como el ladrido de un perro.

Meta también ha destacado que se trata de un modelo multilingüe, lo que permite la producción de voz en seis idiomas (inglés, francés, alemán, español, polaco o portugués), según recoge en su blog oficial.

Para el entrenamiento Voicebox, los investigadores de Meta han empleado más de 50.000 horas de grabaciones de audio y transcripciones procedentes de audiolibros de dominio gratuito en los seis idiomas mencionados.

“Hay muchos casos de uso emocionantes para los modelos de habla generativa -admiten los investigadores de Meta-, pero debido a los posibles riesgos de uso indebido, no estamos poniendo a disposición del público el código o el modelo de Voicebox en este momento. Si bien creemos que es importante ser abiertos con la comunidad de IA y compartir nuestra investigación para avanzar en el estado del arte en IA, también es necesario lograr el equilibrio adecuado entre la apertura y la responsabilidad.”

Europa Press

Economía Futuria Inteligencia artificial

Conforme a los criterios de

Conocé más

Meta dice que Voicebox, su nuevo sintetizador de voz que casi no necesita entrenamiento, es tan bueno que no lo puede liberar al público

Con dos segundos de audio, Voicebox puede sintetizar una voz casi indistinguible de la humana original; Meta la imagina para asistentes digitales y personajes del metaverso, pero por temor a que se use para deepfakes por ahora no permitirá su uso indiscriminado

Temas

Otras noticias de Inteligencia artificial

Preocupaciones. WhatsApp: cómo desactivar el Meta IA, paso a paso

Más competencia para Google (y ChatGPT). La inteligencia artificial Claude ya busca en la Web

Auge tecnológico. Nueva York es la ciudad de EE.UU. con más ofertas de trabajo en esta área clave, según un informe

WhatsApp: por qué algunos usuarios eligen desactivar el Meta IA y cómo hacerlo

Cómo activar el "modo Tini" en WhatsApp

Las mejores actividades para hacer en otoño, según la Inteligencia Artificial

Más competencia para Google (y ChatGPT): la IA Claude 3.7 Sonnet ya busca en la Web

Últimas Noticias

Cambio de estación. Cómo activar el “modo otoño” en WhatsApp

Preocupaciones. WhatsApp: cómo desactivar el Meta IA, paso a paso

Tiernos roedores. Cómo activar el “modo capibara” en WhatsApp

Ahora para comentar debés tener Acceso Digital.

Notificaciones