Retour au feed
arXiv cs.CL·

Learning to Retrieve: Dual-Level Long-Term Memory for Text-to-SQL Agents

Signal
75
Hype
15
En 3 lignesMERIT, un framework de retrieval multi-horizon pour agents text-to-SQL, maintient une mémoire à deux niveaux (épisode et tour) avec des politiques de retrieval apprises par RL. Testé sur BIRD-Interact, il surpasse les baselines sans mémoire et améliore le taux de succès tout en réduisant les tours d'interaction.
Lire la source
Ton avis ?
Agents IAReinforcement learningRaisonnementBenchmarks

Résumé généré par Claude — vérifié par l'humain