On Effectiveness and Efficiency of Agentic Tool-calling and RL Training
Signal
78
Hype
15
En 3 lignesÉtude de l'efficacité et l'efficience du tool-calling dans les agents LLM. Les auteurs montrent que les pipelines d'évaluation sont sensibles à des choix mineurs (seed, prompt système, templates multi-tours) affectant la fiabilité des classements. Ils identifient deux sources de gaspillage computationnel en RL et proposent deux techniques d'accélération sans dégradation de performance.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain