Retour au feed
arXiv cs.AI·

MOCHA: Multi-Objective Chebyshev Annealing for Agent Skill Optimization

Signal
75
Hype
25
En 3 lignesMOCHA est un algorithme d'optimisation multi-objectif pour affiner les skills d'agents LLM. Il utilise la scalarisation de Chebyshev et l'annealing exponentiel pour explorer la frontière de Pareto complète, y compris les régions non-convexes. Sur 6 tâches, MOCHA améliore la performance de 7,5% en moyenne (jusqu'à 14,9% sur FEVER) tout en découvrant deux fois plus de variantes Pareto-optimales que les baselines.
Lire la source
Ton avis ?
Agents IAPrompt engineeringReinforcement learningPapers

Résumé généré par Claude — vérifié par l'humain