Retour au feed
arXiv cs.AI·

NGM: A Plug-and-Play Training-Free Memory Module for LLMs

Signal
72
Hype
25
En 3 lignesNGM est un module mémoire sans entraînement pour LLM qui utilise un encodeur N-gram causal et un injecteur mémoire à porte cosinus. Testé sur Qwen3 (0.6B-14B), il améliore les performances de 0.5-1.2 points en moyenne, avec gains notables en génération de code (+3.0 LiveCodeBench) et tâches knowledge-intensive (+3.03 GPQA).
Lire la source
Ton avis ?
QwenGénération de codeRaisonnementPapers

Résumé généré par Claude — vérifié par l'humain