PROTEA: Offline Evaluation and Iterative Refinement for Multi-Agent LLM Workflows
Signal
78
Hype
18
En 3 lignesPROTEA est une interface pour déboguer et affiner les workflows multi-agents LLM hors ligne. Elle évalue les sorties intermédiaires avec des rubriques configurables, localise les goulots d'étranglement via le graphe du workflow, et génère des révisions de prompts ciblées. Sur deux workflows en production, PROTEA améliore la précision de 64,3% à 83,9% et le Hit@5 de 0,30 à 0,38.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain