arXiv cs.CL·19 mai 2026

Medical Context Distorts Decisions in Clinical Vision Language Models

Signal

Hype

En 3 lignesÉtude arXiv identifiant trois défaillances critiques des vision-language models (VLMs) en contexte clinique : surreliance au texte vs images, dépendance à l'historique clinique non pertinent, sensibilité aux variations de prompt. Tests sur MIMIC-CXR montrent que les décisions VLM sont dominées par la modalité textuelle même avec évidence visuelle disponible.

Lire la source

Ton avis ?

Vision Sécurité IA Évaluations Papers

Résumé généré par Claude — vérifié par l'humain

Medical Context Distorts Decisions in Clinical Vision Language Models

Autres angles sur ce sujet