Video generation models as world simulators
Signal
85
Hype
45
En 3 lignesOpenAI présente Sora, un modèle de diffusion texte-conditionnel entraîné sur vidéos et images de durées, résolutions et formats variables. Basé sur une architecture transformer opérant sur des patches spacetime, Sora génère jusqu'à une minute de vidéo haute fidélité. OpenAI propose que l'échelle des modèles de génération vidéo soit un chemin vers des simulateurs génériques du monde physique.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain