OpenAI, conocida por su exitoso ChatGPT, ha dado un paso adelante en la innovación con su nueva IA, Sora, una herramienta que genera videos realistas a partir de descripciones de texto. Esta nueva tecnología representa un gran avance en la evolución hacia la inteligencia artificial multimodal, combinando texto, imagen y video para ofrecer una experiencia visual impactante.
SORA
Sora es capaz de producir videos de hasta un minuto de duración con una calidad visual sorprendente, siguiendo las instrucciones detalladas del usuario en cuanto a tema y estilo. La IA puede crear videos desde cero a partir de texto o ampliar una imagen fija con material nuevo, demostrando un profundo entendimiento del mundo físico en movimiento.
La presentación de Sora ha generado un gran interés en internet y redes sociales debido al realismo de sus imágenes. Esta nueva herramienta representa un hito en la IA, permitiendo a las personas resolver problemas que requieren interacción en el mundo real de una manera nunca antes vista.
Además, Sora es capaz de generar videos de cualquier resolución y relación de aspecto, incluyendo hasta 1080p. Con un profundo conocimiento del lenguaje, la IA interpreta con precisión las indicaciones del usuario para generar videos con personajes convincentes que expresan emociones vibrantes.
“Estamos enseñando a la IA a comprender y simular el mundo físico en movimiento, con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieren interacción en el mundo real”, explica OpenAI al presentar la nueva herramienta de conversión de texto a video. “Sora puede generar videos de hasta un minuto de duración manteniendo la calidad visual y la fidelidad a las indicaciones del usuario”, añade.
Aquí un ejemplo del ‘prompt’ que ha utilizado OpenAI en uno de sus videos: “Una mujer elegante camina por una calle de Tokio llena de luces de neón brillantes y carteles animados de la ciudad. Lleva una chaqueta de cuero negra, un vestido largo rojo, botas negras y un bolso negro. Lleva lentes de sol y lápiz labial rojo. Camina con confianza y despreocupación. La calle está húmeda y refleja, creando un efecto espejo de las luces de colores. Muchos peatones caminan por ahí”.
Aquí hay un ejemplo más: “Un gato despierta a su dueño dormido exigiéndole el desayuno. El dueño intenta ignorar al gato, pero el gato intenta nuevas tácticas y finalmente el dueño saca un alijo secreto de golosinas de debajo de la almohada para mantener alejado al gato un poco más.”
La llegada de Sora abre nuevas posibilidades en la industria del entretenimiento y la producción audiovisual, pero también plantea desafíos en cuanto a la proliferación de ‘deepfakes’, videos manipulados que pueden ser difíciles de distinguir de los reales. La tecnología enfrenta grandes retos, pero también promete transformar la forma en que interactuamos con el mundo digital.