Efficient Diffusion LLMs via Temporal-Spatial Parallel Decoding and Confidence Extrapolation
Signal
72
Hype
18
En 3 lignesNouvelle méthode pour accélérer les modèles de langage basés sur diffusion (dLLMs). Temporal-Spatial Parallel Decoding (TSPD) et Confidence Extrapolation (CE) réduisent les itérations de débruitage inutiles en analysant les trajectoires token-wise et en prédisant les tendances futures sans entraînement supplémentaire.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain