From AR to Diffusion: Efficiently Adapting Large Language Models with Strictly Causal and Elastic Horizons
Signal
75
Hype
25
En 3 lignesFLUID adapte efficacement les modèles de langage autorégressifs (AR) à la génération par diffusion via l'alignement causal strict et les horizons élastiques. Le framework réduit les coûts d'entraînement de plusieurs ordres de magnitude en réutilisant les checkpoints GPT existants, tout en maintenant la performance état-de-l'art.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain