Skills on the Fly: Test-Time Adaptive Skill Synthesis for LLM Agents
Signal
72
Hype
28
En 3 lignesSkillTTA synthétise des compétences textuelles spécifiques à la tâche en récupérant des trajectoires d'entraînement pertinentes, sans mettre à jour les paramètres du modèle. Évalué sur SpreadsheetBench, ALFWorld et BigCodeBench : Pass@1 passe de 0.397 à 0.505 sur SpreadsheetBench, de 0.517 à 0.651 sur BigCodeBench.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain