Retour au feed
arXiv cs.AI·

SkillGrad: Optimizing Agent Skills Like Gradient Descent

Signal
78
Hype
25
En 3 lignesSkillGrad optimise les compétences d'agents LLM via une approche inspirée de la descente de gradient. Les exécutions de tâches fournissent des signaux de perte, des diagnostics automatiques génèrent des gradients textuels, et un agent avec momentum accumule les patterns récurrents. Évalué sur SpreadsheetBench et WikiTableQuestions, SkillGrad surpasse les baselines de 6,7 points en moyenne.
Lire la source
Ton avis ?
Agents IAReinforcement learningPrompt engineering

Résumé généré par Claude — vérifié par l'humain