Retour au feed
arXiv cs.LG·

Learned Relay Representations for Forward-Thinking Discrete Diffusion Models

Signal
78
Hype
25
En 3 lignesLearned Relay Representations (Relay) permet aux Masked Diffusion Models de propager l'information latente entre étapes de débruitage via un canal par token entraîné en BPTT. Appliqué à Fast-dLLM v2, la méthode surpasse le fine-tuning supervisé sur tâches de code et réduit la latence d'inférence de 32%.
Lire la source
Ton avis ?
Génération de codeRaisonnementPapers

Résumé généré par Claude — vérifié par l'humain