OpenAI Blog·15 février 2024

Video generation models as world simulators

Signal

Hype

En 3 lignesOpenAI présente Sora, un modèle de diffusion texte-conditionnel entraîné sur vidéos et images de durées, résolutions et formats variables. Basé sur une architecture transformer opérant sur des patches spacetime, Sora génère jusqu'à une minute de vidéo haute fidélité. OpenAI propose que l'échelle des modèles de génération vidéo soit un chemin vers des simulateurs génériques du monde physique.

Lire la source

Ton avis ?

OpenAI Génération de vidéos Raisonnement

Résumé généré par Claude — vérifié par l'humain

Video generation models as world simulators

Autres angles sur ce sujet