Retour au feed
arXiv cs.AI·

Focused Forcing: Content-Aware Per-Frame KV Selection for Efficient Autoregressive Video Diffusion

Signal
75
Hype
15
En 3 lignesFocused Forcing optimise les caches KV dans la génération vidéo diffusion autorégressive en sélectionnant par frame et par head les frames historiques pertinents. La méthode combine scores d'attention et scores de diversité, atteignant 1.48× d'accélération sans entraînement tout en améliorant la qualité visuelle et l'alignement textuel.
Lire la source
Ton avis ?
Génération de vidéosRaisonnementÉvaluations

Résumé généré par Claude — vérifié par l'humain