arXiv cs.AI·27 mai 2026

Multi-Stakeholder LLM Alignment: Decomposing Estimation from Aggregation

Signal

Hype

En 3 lignesArticle sur l'alignement multi-parties prenantes des LLM. Les juges holistiques confondent estimation et agrégation d'utilité, créant du bruit de pondération instable. DecompR sépare calibration contrefactuelle des poids (fixes avant scoring) et estimation indépendante des utilités par rôle, réduisant la dérive des poids et le bruit d'estimation.

Lire la source

Ton avis ?

Alignement Évaluations Raisonnement

Résumé généré par Claude — vérifié par l'humain

Multi-Stakeholder LLM Alignment: Decomposing Estimation from Aggregation

Autres angles sur ce sujet