Retour au feed
arXiv cs.LG·

LoopQ: Quantization for Recursive Transformers

Signal
78
Hype
15
En 3 lignesLoopQ est un framework de quantification post-entraînement (PTQ) conçu pour les modèles de langage récursifs (LoopLMs) qui réutilisent les blocs Transformer. Il résout trois défis : décalage de distribution entre rôles, réutilisation d'état entre boucles, et accumulation d'erreur récursive. Sous quantification W4A4, LoopQ améliore la précision de 68,8% et réduit la perplexité de 87,7% vs baseline PTQ statique.
Lire la source
Ton avis ?
RaisonnementBenchmarks

Résumé généré par Claude — vérifié par l'humain