Retour au feed
arXiv cs.CL·

Training-Free Cultural Alignment of Large Language Models via Persona Disagreement

Signal
78
Hype
22
En 3 lignesDISCA, une méthode d'inférence sans entraînement, aligne culturellement les LLM via désaccord socio-démographique intra-pays. Testée sur 20 pays et 7 backbones (2B–70B), elle réduit le désalignement culturel de 10–24% sur MultiTP sans modifier les poids du modèle.
Lire la source
Ton avis ?
AlignementSécurité IAPapersBenchmarks

Résumé généré par Claude — vérifié par l'humain