Same Patient, Different Words, Different Diagnosis? Evaluating Semantic Stability in Clinical LLMs
Signal
78
Hype
15
En 3 lignesÉtude de la stabilité sémantique de 16 LLMs (génériques et médicaux) face à des reformulations de prompts cliniquement équivalentes. Propose un cadre de vérification basé sur l'inférence en langage naturel et trois métriques (MVS, ΔC, WCI). Résultat : la spécialisation domaine n'améliore pas systématiquement la robustesse aux variations sémantiques.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain