AdaptiveLoad: Towards Efficient Video Diffusion Transformer Training
Signal
78
Hype
15
En 3 lignesAdaptiveLoad optimise l'entraînement des Transformers de diffusion vidéo (DiT, MMDiT) en résolvant le déséquilibre de charge causé par la complexité quadratique de l'attention. Deux composants : équilibrage adaptatif dual et kernel CUDA LayerNorm-Modulate fusionné. Sur Wan 2.1 : déséquilibre computationnel réduit de 39% à 18,9%, utilisation VRAM +22,7%, débit +27,2%.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain