Así es la Inteligencia Artificial que genera videos a partir de texto

Sora, la nueva herramienta de OpenAI, puede generar videos de un minuto con escenas complejas y más de un personaje a partir de una descripción

22 de febrero de 2024
17:18
3 minutos de lectura'

OpenAI ha presentado su primera herramienta de IA para generar vídeo sintético directamente a partir de texto, denominada Sora (AP Foto/Michael Dwyer, Archivo)Michael Dwyer - AP

Mientras OpenAI se esfuerza en evaluar la seguridad de ChatGPT-4 y revela las principales características de su futura IA multimodal GPT-5 para competir con Gemini, parece evidente que la empresa, dirigida nuevamente por Sam Altman, busca mantener su posición de liderazgo en una industria que prácticamente iniciaron. Aunque su evolución plantea preocupaciones sobre la posible amenaza para hasta el 60% de los empleos mundiales debido a la Inteligencia Artificial.

A pesar de ello, OpenAI presentó su primera herramienta de Inteligencia Artificial para generar videos sintéticos a partir de texto, llamada Sora. La empresa, con sede en San Francisco, California, describe a Sora como un modelo de IA capaz de crear escenas realistas e imaginativas según instrucciones de texto, generando videos de hasta un minuto de duración con calidad visual y cumpliendo las indicaciones del usuario.

Un fotograma de un vídeo de una carrera de bicicletas en el océano de diferentes animales creado por inteligencia artificial.

OpenAI señala que actualmente están enseñando a la IA a comprender y simular entornos físicos en movimiento, pero los ejemplos de videos generados hasta el momento sugieren un rendimiento prometedor, a pesar de estar en una fase de desarrollo no accesible al público. La empresa comparte sus avances para que los primeros betatesters puedan probarla, ofrecer comentarios y contribuir al perfeccionamiento antes de su lanzamiento comercial.

En cuanto a sus capacidades, Sora puede generar escenas complejas con múltiples personajes, animales y objetos, así como crear movimientos y mantener detalles precisos del fondo. OpenAI destaca que el modelo comprende no solo las instrucciones del usuario, sino también cómo existen y funcionan esas cosas en el mundo real, lo cual resulta impresionante.

Cómo funciona SORA

Captura de uno de los videos generados por Sora

La operación de Sora es bastante simple: el usuario ingresa una serie de contenidos en la plataforma y, posteriormente, estos se reflejan automáticamente en las imágenes generadas. El programa aprovecha la tecnología de modelos de lenguaje como GPT y gracias al entrenamiento detallado realizado por sus creadores, comprende el lenguaje natural del usuario para producir imágenes a través de comandos específicos.

Este proceso da lugar a la creación de nuevos conjuntos de imágenes, que pueden ser utilizados, por ejemplo, como escenografía en una película o como fondo para un usuario de TikTok gracias a la extensa biblioteca de videos a la que Sora tiene acceso. Además, puede reconocer detalles específicos en respuesta a las solicitudes, como el tipo de personas presentes en las imágenes, su vestimenta, accesorios o efectos visuales.

Sin embargo, como es un producto en desarrollo presenta algunas limitaciones, como la simulación inconsistente de físicas en escenas complejas y la posibilidad de confusiones en causas y efectos de ciertos movimientos. Aunque OpenAI anticipa mejoras y una rápida evolución, el futuro que se insinúa plantea un dilema entre lo impresionante, lo interesante y lo aterrador.

SORA: límite de 60 segundos

La versión actualmente operativa de Sora puede crear videos utilizando Inteligencia Artificial con una duración máxima de 60 segundos.

Las pruebas iniciales aún no están disponibles al público; actualmente, solo los investigadores de OpenAI que continúan validando su diseño tienen acceso. Por otro lado, la compañía anunció que Sora se incorporará a su conjunto de productos en los próximos meses, aunque la fecha exacta aún no ha sido especificada.

LA NACION

Así es la Inteligencia Artificial que genera videos a partir de texto

Sora, la nueva herramienta de OpenAI, puede generar videos de un minuto con escenas complejas y más de un personaje a partir de una descripción

Cómo funciona SORA

SORA: límite de 60 segundos

Seguí leyendo

Muy personalizado. Cómo es Carina, la nueva asistente virtual de WhatsApp que funciona con IA

Con 77 años. Así se vería Freddie Mercury si estuviese vivo hoy en día

Jefe de OpenAI advierte que un "descuadre social" podría hacer peligrosa la inteligencia artificial

Otras noticias de Tecnología

¿La pantalla que usará el iPhone? Oppo presenta el Find N6, el primer plegable con pliegue imperceptible

Todo lo que prepara Apple para este año. El iPhone plegable, una MacBook Ultra y AirPods con cámaras

Expoagro 2026. La agenda completa de actividades de la edición de este año

Cómo activar el “modo Capibara” de WhatsApp en marzo 2026

Xiaomi incorpora robots humanoides a su fábrica de autos eléctricos en Pekín

¿Qué profesiones van a desaparecer con la IA? Uno de los expertos argentinos más escuchados responde

Día de la Mujer 2026: 150 frases para enviar por WhatsApp

Últimas Noticias

¿Qué profesiones van a desaparecer con la IA? Uno de los expertos argentinos más escuchados responde

¿La pantalla que usará el iPhone? Oppo presenta el Find N6, el primer plegable con pliegue imperceptible

Todo lo que prepara Apple para este año. El iPhone plegable, una MacBook Ultra y AirPods con cámaras