arXiv cs.CL·3 juin 2026

MemTrain: Self-Supervised Context Memory Training

Signal

Hype

En 3 lignesMemTrain propose un cadre d'entraînement auto-supervisé pour améliorer les capacités de mémoire contextuelle des agents LLM. Deux tâches proxy sur Wikipedia (reconstruction d'entités masquées et rappel de mémoire intermédiaire) sont optimisées conjointement avec GRPO. Gains jusqu'à 17,67 points sur QA long-texte et benchmarks de recherche.

Lire la source

Ton avis ?

Agents IA Reinforcement learning Papers Benchmarks

Résumé généré par Claude — vérifié par l'humain

MemTrain: Self-Supervised Context Memory Training

Autres angles sur ce sujet