Retour au feed
arXiv cs.AI·

Skills on the Fly: Test-Time Adaptive Skill Synthesis for LLM Agents

Signal
72
Hype
28
En 3 lignesSkillTTA synthétise des compétences textuelles spécifiques à la tâche en récupérant des trajectoires d'entraînement pertinentes, sans mettre à jour les paramètres du modèle. Évalué sur SpreadsheetBench, ALFWorld et BigCodeBench : Pass@1 passe de 0.397 à 0.505 sur SpreadsheetBench, de 0.517 à 0.651 sur BigCodeBench.
Lire la source
Ton avis ?
Agents IAPrompt engineeringBenchmarksPapers

Résumé généré par Claude — vérifié par l'humain