Retour au feed
arXiv cs.CL·

Efficient Diffusion LLMs via Temporal-Spatial Parallel Decoding and Confidence Extrapolation

Signal
72
Hype
18
En 3 lignesNouvelle méthode pour accélérer les modèles de langage basés sur diffusion (dLLMs). Temporal-Spatial Parallel Decoding (TSPD) et Confidence Extrapolation (CE) réduisent les itérations de débruitage inutiles en analysant les trajectoires token-wise et en prédisant les tendances futures sans entraînement supplémentaire.
Lire la source
Ton avis ?
Génération de codeRaisonnementPapers

Résumé généré par Claude — vérifié par l'humain