Retour au feed
arXiv cs.CL·

QUEST: Training Frontier Deep Research Agents with Fully Synthetic Tasks

Signal
82
Hype
25
En 3 lignesQUEST est une famille de modèles open-source (2B à 35B) entraînés comme agents de recherche profonde via une pipeline de synthèse de données et RL. Avec seulement 8K tâches synthétiques, QUEST égale ou surpasse les systèmes propriétaires sur 8 benchmarks de recherche, excelle en citation et synthèse de rapports. Code, données et modèles publiés.
Lire la source
Ton avis ?
Agents IAReinforcement learningOpen sourceBenchmarksRAG

Résumé généré par Claude — vérifié par l'humain