arXiv cs.AI·19 mai 2026

Training-Free Cultural Alignment of Large Language Models via Persona Disagreement

Signal

Hype

En 3 lignesDISCA, une méthode d'inférence sans entraînement, aligne culturellement les LLM via des agents-personas basés sur le World Values Survey. Testée sur 20 pays et 7 backbones (2B–70B), elle réduit le désalignement culturel de 10–24% sur MultiTP sans modifier les poids du modèle.

Lire la source

Ton avis ?

Alignement Raisonnement Évaluations Sécurité IA

Résumé généré par Claude — vérifié par l'humain

Training-Free Cultural Alignment of Large Language Models via Persona Disagreement

Autres angles sur ce sujet