OpenAI presenta 'Sora', su nueva IA que genera video con instrucciones de texto

  • Tras sus modelos generativos de texto e imagen, ChatGPT y DALL-E, la compañía da un paso más con una tecnología capaz de "entender cómo existen los objetos en el mundo físico"

OpenAI ha presentado este jueves 'Sora' su nuevo modelo de inteligencia artificial generativa, que acepta instrucciones en texto y las convierte en escenas de video, realistas, con múltiples caracteres y movimientos específicos.

Después de haber desarrollado ChatGPT y DALL-E, que generan texto e imagen gracias a la IA, la compañía dirigida por Sam Altman ha detallado la capacidad de 'Sora' para crear "escenas complejas con detalles del componente principal y el trasfondo".

Google incorpora nuevas herramientas de búsqueda impulsadas por IA
Google incorpora nuevas herramientas de búsqueda impulsadas por IA
Google incorpora nuevas herramientas de búsqueda impulsadas por IA

Google incorpora nuevas herramientas de búsqueda impulsadas por IA

Además, Sora puede "entender cómo existen los objetos en el mundo físico" y tiene la capacidad de "interpretar acertadamente las instrucciones y de generar caracteres convincentes que expresan emociones vibrantes", ha añadido.

EL "CIELO" DE LA IA

'Sora' es el término en japonés para "cielo" y la compañía todavía no la ha puesto a disposición del público porque sigue analizándola para comprender los peligros del sistema, según indicó el diario The New York Times.

The New York Times demanda a Microsoft y a OpenAI por usar sus textos sin permiso
The New York Times demanda a Microsoft y a OpenAI por usar sus textos sin permiso
The New York Times demanda a Microsoft y a OpenAI por usar sus textos sin permiso

The New York Times demanda a Microsoft y a OpenAI por usar sus textos sin permiso

En cambio OpenAI ha compartido la tecnología con un pequeño grupo de académicos y otros investigadores externos cuya tarea es detectar las maneras en las cuales 'Sora' podría usarse con fines maliciosos.

Steven Levy, de la revista Wired, describió su experiencia cuando OpenAi le permitió ver, aunque no operar, el modelo 'Sora' en respuesta a la instrucción en texto para crear una escena de la ciudad de Tokio captada por una cámara que se mueve por las calles, sigue a algunas personas en un día con nieve.

Los peligros de 'Sora' de OpenIA... ¿Qué puede salir mal?
Los peligros de 'Sora' de OpenIA... ¿Qué puede salir mal?
Los peligros de 'Sora' de OpenIA... ¿Qué puede salir mal?

Los peligros de 'Sora' de OpenIA... ¿Qué puede salir mal?

"El resultado es una vista convincente de lo que es, sin duda, Tokio en ese momento, cuando coexisten los copos de nieve y los capullos de cerezos" escribió Levy. "La cámara virtual, colocada en un robot volador (dron), sigue a una pareja que camina por el paisaje".

La firma indica que 'Sora' permite la creación de muchos mundos, con escenas realistas o fantásticas, tridimensionales, con movimientos fluidos, y aún en las escenas que no existen en el mundo real, el modelo aplica las reglas físicas correctas.

La IA, el ingrediente que faltaba en la nueva gastronomía
La IA, el ingrediente que faltaba en la nueva gastronomía
La IA, el ingrediente que faltaba en la nueva gastronomía

La IA, el ingrediente que faltaba en la nueva gastronomía

De este modo, OpenAI, que revolucionó el emergente sector de los servicios de IA regenerativa, dispondrá de un conjunto de servicios que van desde la generación de texto, imagen estática y video.