Retour au feed
arXiv cs.CL·

FlowLM: Few-Step Language Modeling via Diffusion-to-Flow Adaptation

Signal
78
Hype
25
En 3 lignesFlowLM transforme des modèles de langage par diffusion pré-entraînés en modèles de flux via fine-tuning efficace. En réalignant les trajectoires courbes en lignes droites, FlowLM génère du texte haute qualité en quelques étapes, rivalisant avec 2000 étapes de diffusion. La saturation des performances est atteinte en moitié moins d'epochs d'entraînement.
Lire la source
Ton avis ?
Génération de codeRaisonnementPapers

Résumé généré par Claude — vérifié par l'humain