arXiv cs.CL·21 mai 2026

MTR-Suite: A Framework for Evaluating and Synthesizing Conversational Retrieval Benchmarks

Signal

Hype

En 3 lignesMTR-Suite est un framework pour évaluer et synthétiser des benchmarks de retrieval conversationnel. Il comprend MTR-Eval (auditeur basé LLM), MTR-Pipeline (système multi-agent générant des dialogues à 1/400e du coût humain), et MTR-Bench (benchmark général). Code et données publics.

Lire la source

Ton avis ?

RAG Multi-agents Benchmarks Évaluations Open source

Résumé généré par Claude — vérifié par l'humain

MTR-Suite: A Framework for Evaluating and Synthesizing Conversational Retrieval Benchmarks

Autres angles sur ce sujet