ISE: An Execution-Grounded Recipe for Multi-Turn OS-Agent Trajectories
Signal
82
Hype
15
En 3 lignesISE est un paradigme de synthèse en trois étapes pour générer des trajectoires d'agents OS multi-tours avec exécution réelle. 43 956 intents structurés, 23 132 trajectoires (8,12 tours utilisateur en moyenne), exécution live en sandbox. Fine-tuning Qwen3-8B sur ISETrace : ClawEval 19,3→37,7 pass@1, surpasse GPT-4o zéro-shot et Qwen3-32B.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain