Retour au feed
arXiv cs.CL·

Medical Context Distorts Decisions in Clinical Vision Language Models

Signal
72
Hype
18
En 3 lignesÉtude arXiv identifiant trois défaillances critiques des vision-language models (VLMs) en contexte clinique : surreliance au texte vs images, dépendance à l'historique clinique non pertinent, sensibilité aux variations de prompt. Tests sur MIMIC-CXR montrent que les décisions VLM sont dominées par la modalité textuelle même avec évidence visuelle disponible.
Lire la source
Ton avis ?
VisionSécurité IAÉvaluationsPapers

Résumé généré par Claude — vérifié par l'humain