Retour au feed
arXiv cs.CL·

PROTEA: Offline Evaluation and Iterative Refinement for Multi-Agent LLM Workflows

Signal
78
Hype
18
En 3 lignesPROTEA est une interface pour déboguer et affiner les workflows multi-agents LLM hors ligne. Elle évalue les sorties intermédiaires avec des rubriques configurables, localise les goulots d'étranglement via le graphe du workflow, et génère des révisions de prompts ciblées. Sur deux workflows en production, PROTEA améliore la précision de 64,3% à 83,9% et le Hit@5 de 0,30 à 0,38.
Lire la source
Ton avis ?
Multi-agentsAgents IAPrompt engineeringÉvaluationsOutils

Résumé généré par Claude — vérifié par l'humain