MemTrain: Self-Supervised Context Memory Training
Signal
78
Hype
15
En 3 lignesMemTrain propose un cadre d'entraînement auto-supervisé pour améliorer les capacités de mémoire contextuelle des agents LLM. Deux tâches proxy sur Wikipedia (reconstruction d'entités masquées et rappel de mémoire intermédiaire) sont optimisées conjointement avec GRPO. Gains jusqu'à 17,67 points sur QA long-texte et benchmarks de recherche.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain