CANTANTE: Optimizing Agentic Systems via Contrastive Credit Attribution [R]
Signal
82
Hype
28
En 3 lignesCANTANTE résout le problème d'attribution de crédit dans les systèmes multi-agents LLM en décomposant les récompenses globales en signaux d'optimisation par agent. Évalué sur MBPP, GSM8K et HotpotQA, l'approche surpasse GEPA et MIPROv2 (+18.9 pts MBPP, +12.5 pts GSM8K) sans surcoût d'inférence.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain