EUDAIMONIA: Evaluating Undesirable Dynamics in AI
EUDAIMONIA est un benchmark d'évaluation des dynamiques sociales nuisibles dans les LLM. Il contient 969 inputs utilisateur et 3,147 vérifications de violations de design, testant 22 modèles récents. Claude-Opus-4.7 et GPT-5.5 violent respectivement 30,7% et 27,2% des critères, révélant des problèmes persistants d'alignement social non résolus par le reasoning étendu.