ACC: Compiling Agent Trajectories for Long-Context Training
Signal
78
Hype
25
En 3 lignesACC convertit les trajectoires d'agents (recherche, ingénierie logicielle, requêtes BD) en paires QA long-contexte pour l'entraînement SFT. Élimine le masquage des réponses d'outils et crée une supervision explicite sur les dépendances distantes. Qwen3-30B-A3B atteint +18.1 sur MRCR et +7.6 sur GraphWalks, comparable à Qwen3-235B.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain