La empresa OpenAI, uno de los líderes en inteligencia artificial generativa, ha presentado su modelo ‘Sora’ que acepta instrucciones en texto y las convierte en escenas de vídeo, realistas, con múltiples caracteres y movimientos específicos.
‘Sora’ es capaz de crear «vídeos de hasta 60 segundos con escenas altamente detalladas, un movimiento de cámara complejo y múltiples personajes con emociones vibrantes», según ha indicado en la red social X la firma, establecida en 2015 y dirigida por Sam Altman, que ha desarrollado ChatGPT y el generador de imágenes fijas DALL-E.
En este sentido, OpenAI ha publicado algunas de las escenas creadas: una cámara sigue se mueve por las calles de Tokio, siguiendo a dos personas que caminan entre árboles de cerezos; varios mamuts corriendo en una montaña nevada; o incluso, el tráiler de una película sobre un astronauta situado en un desierto de sal.
Aún no está disponible para el público
‘Sora’ es el término en japones para «cielo» y la compañía todavía no la ha puesto a disposición del público porque sigue analizándola para comprender los peligros del sistema, según ha señalado el diario The New York Times. En cambio, OpenAI ha asegurado que ha compartido la tecnología con un pequeño grupo de académicos y otros investigadores externos cuya tarea es detectar maneras en las que ‘Sora’ podría usarse con fines maliciosos.
«Tomaremos varias medidas de seguridad importantes antes de que ‘Sora’ esté disponible en los productos de OpenAI. Estamos trabajando con expertos en áreas como desinformación, contenido que incita al odio y prejuicios que están probando el modelo» ha indicado la empresa en una publicación en X.
El periodista Steven Levy, de la revista Wired, ha sido uno de los ha podido ver el modelo en marcha, concretamente, la escena en Tokio, aunque no operar con ‘Sora’. «El resultado es una vista convincente de lo que es, sin duda, Tokio en ese momento, cuando coexisten los copos de nieve y los capullos de cerezos» ha relatado Levy.
Puede crear escenas realistas o fantásticas
La firma indica que ‘Sora’ permite la creación de muchos mundos, con escenas realistas o fantásticas, tridimensionales, con movimientos fluidos, y aún en las escenas que no existen en el mundo real, el modelo aplica las reglas físicas correctas.
Otras de las escenas creadas han sido un arrecife de coral hecho de papel y plagado de peces de colores y criaturas marinas; o un pequeño monstruo en 3D que mira una vela con la boca abierta; o una mujer nipona que camina por las calles de Tokio, vestida y maquillada tal y como se ha descrito en el texto que se le ha proporcionado.
De este modo, OpenAI dispondrá así de un conjunto de servicios que van desde la generación de texto, imagen estática y vídeo, en pleno debate sobre las limitaciones, peligros y beneficios que puede desentrañar este tipo de tecnología.