Retour au feed
arXiv cs.CL·

Same Patient, Different Words, Different Diagnosis? Evaluating Semantic Stability in Clinical LLMs

Signal
78
Hype
15
En 3 lignesÉtude de la stabilité sémantique de 16 LLMs (génériques et médicaux) face à des reformulations de prompts cliniquement équivalentes. Propose un cadre de vérification basé sur l'inférence en langage naturel et trois métriques (MVS, ΔC, WCI). Résultat : la spécialisation domaine n'améliore pas systématiquement la robustesse aux variations sémantiques.
Lire la source
Ton avis ?
ÉvaluationsSécurité IARaisonnementBenchmarks

Résumé généré par Claude — vérifié par l'humain