LoopQ: Quantization for Recursive Transformers
Signal
78
Hype
15
En 3 lignesLoopQ est un framework de quantification post-entraînement (PTQ) conçu pour les modèles de langage récursifs (LoopLMs) qui réutilisent les blocs Transformer. Il résout trois défis : décalage de distribution entre rôles, réutilisation d'état entre boucles, et accumulation d'erreur récursive. Sous quantification W4A4, LoopQ améliore la précision de 68,8% et réduit la perplexité de 87,7% vs baseline PTQ statique.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain