Retour au feed
arXiv cs.CL·

MemTrain: Self-Supervised Context Memory Training

Signal
78
Hype
15
En 3 lignesMemTrain propose un cadre d'entraînement auto-supervisé pour améliorer les capacités de mémoire contextuelle des agents LLM. Deux tâches proxy sur Wikipedia (reconstruction d'entités masquées et rappel de mémoire intermédiaire) sont optimisées conjointement avec GRPO. Gains jusqu'à 17,67 points sur QA long-texte et benchmarks de recherche.
Lire la source
Ton avis ?
Agents IAReinforcement learningPapersBenchmarks

Résumé généré par Claude — vérifié par l'humain