Lost in Interpretation: The Plausibility-Faithfulness Trade-off in Cross-Lingual Explanations
Signal
75
Hype
15
En 3 lignesLes explications en anglais pour auditer des LLM multilingues masquent un compromis : elles obtiennent un meilleur accord avec les rationales humaines mais perdent leur ancrage causal dans les prédictions du modèle. Sur 3 tâches et 5 langues, la compréhensibilité se dégrade jusqu'à 5,7x en pivot anglais, même avec une précision stable. Les auteurs recommandent d'auditer dans la langue d'entrée.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain