Retour au feed
arXiv cs.AI·

Multi-Stakeholder LLM Alignment: Decomposing Estimation from Aggregation

Signal
72
Hype
15
En 3 lignesArticle sur l'alignement multi-parties prenantes des LLM. Les juges holistiques confondent estimation et agrégation d'utilité, créant du bruit de pondération instable. DecompR sépare calibration contrefactuelle des poids (fixes avant scoring) et estimation indépendante des utilités par rôle, réduisant la dérive des poids et le bruit d'estimation.
Lire la source
Ton avis ?
AlignementÉvaluationsRaisonnement

Résumé généré par Claude — vérifié par l'humain