Retour au feed
arXiv cs.CL·

Evaluation Drift in LLM Personality Induction: Are We Moving the Goalpost?

Signal
72
Hype
15
En 3 lignesÉtude sur l'induction de personnalité dans les LLM via fine-tuning (SFT, DPO, ORPO) sur essais longs associés aux profils Big Five. Fine-tuning réduit la variance des réponses au questionnaire IPIP-NEO, mais la précision sur le profil complet reste aléatoire. Les essais non guidés manquent de signaux pour exprimer fidèlement la personnalité.
Lire la source
Ton avis ?
Fine-tuningÉvaluationsAlignement

Résumé généré par Claude — vérifié par l'humain