Training-Free Cultural Alignment of Large Language Models via Persona Disagreement
Signal
75
Hype
25
En 3 lignesDISCA, une méthode d'inférence sans entraînement, aligne culturellement les LLM via des agents-personas basés sur le World Values Survey. Testée sur 20 pays et 7 backbones (2B–70B), elle réduit le désalignement culturel de 10–24% sur MultiTP sans modifier les poids du modèle.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain