Retour au feed
arXiv cs.CL·

SENSE: Semantic Embedding Navigation with Soft-gated Evaluation for Retrieval-based Speculative Decoding

Signal
78
Hype
25
En 3 lignesSENSE améliore le décodage spéculatif basé sur la récupération en utilisant les états cachés du modèle cible pour l'alignement sémantique. Un module d'évaluation soft-gated valide l'équivalence sémantique plutôt que les formes de surface. Sur LLaMA et Qwen, SENSE atteint 4.09 longueur d'acceptation moyenne et 3.26x d'accélération.
Lire la source
Ton avis ?
LlamaQwenRaisonnementGénération de codeBenchmarks

Résumé généré par Claude — vérifié par l'humain