Retour au feed
arXiv cs.CL·

MTR-Suite: A Framework for Evaluating and Synthesizing Conversational Retrieval Benchmarks

Signal
78
Hype
25
En 3 lignesMTR-Suite est un framework pour évaluer et synthétiser des benchmarks de retrieval conversationnel. Il comprend MTR-Eval (auditeur basé LLM), MTR-Pipeline (système multi-agent générant des dialogues à 1/400e du coût humain), et MTR-Bench (benchmark général). Code et données publics.
Lire la source
Ton avis ?
RAGMulti-agentsBenchmarksÉvaluationsOpen source

Résumé généré par Claude — vérifié par l'humain