arXiv cs.CL·19 mai 2026

Evaluation Drift in LLM Personality Induction: Are We Moving the Goalpost?

Signal

Hype

En 3 lignesÉtude sur l'induction de personnalité dans les LLM via fine-tuning (SFT, DPO, ORPO) sur essais longs associés aux profils Big Five. Fine-tuning réduit la variance des réponses au questionnaire IPIP-NEO, mais la précision sur le profil complet reste aléatoire. Les essais non guidés manquent de signaux pour exprimer fidèlement la personnalité.

Lire la source

Ton avis ?

Fine-tuning Évaluations Alignement

Résumé généré par Claude — vérifié par l'humain

Evaluation Drift in LLM Personality Induction: Are We Moving the Goalpost?

Autres angles sur ce sujet