arXiv cs.AI·19 mai 2026

LoopQ: Quantization for Recursive Transformers

Signal

Hype

En 3 lignesLoopQ propose une méthode de quantization post-training (PTQ) adaptée aux modèles de langage récursifs (LoopLMs) qui réutilisent les blocs Transformer. La méthode adresse trois défis : décalage de distribution entre rôles, réutilisation d'état entre boucles, et accumulation d'erreur récursive. Résultats : +68,8% précision et -87,7% perplexité en W4A4 vs baseline.

Lire la source

Ton avis ?

Fine-tuning Benchmarks Raisonnement

Résumé généré par Claude — vérifié par l'humain

LoopQ: Quantization for Recursive Transformers

Autres angles sur ce sujet