Medical Context Distorts Decisions in Clinical Vision Language Models
Signal
72
Hype
18
En 3 lignesÉtude arXiv identifiant trois défaillances critiques des vision-language models (VLMs) en contexte clinique : surreliance au texte vs images, dépendance à l'historique clinique non pertinent, sensibilité aux variations de prompt. Tests sur MIMIC-CXR montrent que les décisions VLM sont dominées par la modalité textuelle même avec évidence visuelle disponible.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain