Learned Relay Representations for Forward-Thinking Discrete Diffusion Models
Signal
78
Hype
25
En 3 lignesLearned Relay Representations (Relay) permet aux Masked Diffusion Models de propager l'information latente entre étapes de débruitage via un canal par token entraîné en BPTT. Appliqué à Fast-dLLM v2, la méthode surpasse le fine-tuning supervisé sur tâches de code et réduit la latence d'inférence de 32%.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain