arXiv cs.AI·20 mai 2026

MOCHA: Multi-Objective Chebyshev Annealing for Agent Skill Optimization

Signal

Hype

En 3 lignesMOCHA est un algorithme d'optimisation multi-objectif pour affiner les skills d'agents LLM. Il utilise la scalarisation de Chebyshev et l'annealing exponentiel pour explorer la frontière de Pareto complète, y compris les régions non-convexes. Sur 6 tâches, MOCHA améliore la performance de 7,5% en moyenne (jusqu'à 14,9% sur FEVER) tout en découvrant deux fois plus de variantes Pareto-optimales que les baselines.

Lire la source

Ton avis ?

Agents IA Prompt engineering Reinforcement learning Papers

Résumé généré par Claude — vérifié par l'humain

MOCHA: Multi-Objective Chebyshev Annealing for Agent Skill Optimization

Autres angles sur ce sujet