Mira Murati, la directora de tecnología de OpenAI, no dejó en claro qué tipo de videos usaron para entrenar a la nueva IA capaz de generar videos; la sospecha es que podrían haber usado contenido con derechos de autor sin autorización; la compañía ya enfrenta varios juicios al respecto
- 3 minutos de lectura'
A mediados de febrero, OpenAI (la compañía detrás de ChatGPT) presentó Sora, una herramienta de inteligencia artificial generativa que permite crear videos de alta calidad de un minuto de duración a partir de una descripción de texto, similar a lo que ya se podía hacer con imágenes (con aplicaciones como Dall-E, Midjourney o Stable Diffusion), que recién estará disponible a fin de año, pero que ya le está generando momentos incómodos antes de estar liberada al público en general, tal como demostró una entrevista reciente a su principal directiva.
Aunque tiene algunas limitaciones, y las animaciones pueden tener errores, los primeros resultados han sorprendido por la calidad y versatilidad de sus animaciones, como pueden apreciarse en este video:
Un momento incómodo
Mientras tanto, Mira Murati, creadora del ChatGPT original y una de las máximas ejecutivas de OpenAI (y su CEO durante un fin de semana tumultuoso) accedió a una entrevista con Joanna Stern, periodista del Wall Street Journal, para explicar cómo funciona Sora y qué capacidad tiene.
En un momento de la entrevista, Stern le hizo una pregunta clave a Murati, sobre el origen de los contenidos que se usaron para entrenar a Sora, el motor para generar videos, y lograr que sea tan dúctil: es necesario que se haya usado una gran cantidad de videos.
-¿Qué información fue usada para entrenar a Sora?
-Usamos información disponible públicamente y contenido licenciado.
-¿Y videos en YouTube?
-No estoy segura.
-¿Videos de Facebook, Instagram?
-Si estaban disponibles públicamente para usar, puede que estén en los datos, pero no estoy segura
Me: What data was used to train Sora? YouTube videos?
— Joanna Stern (@JoannaStern) March 14, 2024
OpenAI CTO: I'm actually not sure about that...
(I really do encourage you to watch the full @WSJ interview where Murati did answer a lot of the biggest questions about Sora. Full interview, ironically, on YouTube:… pic.twitter.com/51O8Wyt53c
Murati sí confirma que usaron videos licenciados de Shutterstock para educar a Sora. Las evasivas de Murati (que es directora de tecnología de OpenAI) son importantes: los modelos grandes de lenguaje, o LLM (el nombre técnico para las inteligencias artificiales generativas como GPT, el Gemini de Google o Llama de Meta, por ejemplo) se entrenan suministrándoles cantidades descomunales de contenido: textos de todo tipo en el caso de los chatbots, imágenes para educar a los generadores de imágenes, música para los de audio, y lógicamente video para los creadores de video como Sora.
Pero hace tiempo que los creadores de contenido sospechan que sus creaciones se usaron para educar a estos motores sin autorización y sin pago de regalías: en enero del año pasado varios artistas gráficos demandaron a Stable Diffusion por usar sus obras para entrenar a sus IA generativas (que sumaron entre sus capacidades la posibilidad de emular sus estilos de dibujo); también lo hicieron, en julio pasado, la comediante Sarah Silverman y los escritores Paul Tremblay y Mona Awad, ya que sospechan que sus libros son parte del corpus con los que se educó a GPT; en diciembre último se sumó el New York Times, que sospecha que los artículos disponibles en su sitio son una de las fuentes con las que se educó a ChatGPT. En todos los casos, la queja es la misma: estas nuevas herramientas necesitan muchos datos para aprender a reconocer patrones, emular estilos y demás, y sería muy difícil lograrlo solo con contenido sin derechos de autor. Era previsible que en una entrevista alguien hiciera esa pregunta; es sorprendente que no hayan tenido lista una respuesta que no deje dudas al respecto, como sí lo hizo con otros aspectos técnicos del notable motor de generación de videos de OpenAI.
Aquí está la entrevista completa.
Otras noticias de Inteligencia artificial
Más leídas de Tecnología
En enero. ChatGPT prepara una función clave para transformarse en un verdadero asistente
Clave. Los trucos de WhatsApp más sencillos, prácticos y desconocidos que deberías aprender
Para que el trabajo se distinga del resto. Ahora es más fácil sumar una imagen creada por IA a Google Docs
Para fanáticos. Cómo activar el “modo Merlina Addams” en WhatsApp