arXiv cs.CL·26 mai 2026

QUEST: Training Frontier Deep Research Agents with Fully Synthetic Tasks

Signal

Hype

En 3 lignesQUEST est une famille de modèles open-source (2B à 35B) entraînés comme agents de recherche profonde via une pipeline de synthèse de données et RL. Avec seulement 8K tâches synthétiques, QUEST égale ou surpasse les systèmes propriétaires sur 8 benchmarks de recherche, excelle en citation et synthèse de rapports. Code, données et modèles publiés.

Lire la source

Ton avis ?

Agents IA Reinforcement learning Open source Benchmarks RAG

Résumé généré par Claude — vérifié par l'humain

QUEST: Training Frontier Deep Research Agents with Fully Synthetic Tasks

Autres angles sur ce sujet