Retour au feed
arXiv cs.CL·

Firefly: Illuminating Large-Scale Verified Tool-Call Data Generation from Real APIs

Signal
82
Hype
18
En 3 lignesFireFly génère des données vérifiées pour l'entraînement d'agents tool-calling à partir de vrais serveurs MCP. Le pipeline inverse la synthèse standard : exploration d'APIs réelles via structures DAG, puis génération rétroactive de tâches à partir des résultats observés. 5 144 tâches vérifiées sur 240 serveurs et 993 outils. Un modèle 4B entraîné avec GRPO égale Claude Sonnet sur le test set.
Lire la source
Ton avis ?
Agents IAMCPGénération de codeReinforcement learningBenchmarks

Résumé généré par Claude — vérifié par l'humain