Retour au feed
arXiv cs.CL·

How Good LLMs Are at Answering Bangla Medical Visual Questions? Dataset and Benchmarking

Signal
72
Hype
18
En 3 lignesBanglaMedVQA : nouveau benchmark de questions visuelles médicales en bengali avec paires image-question-réponse validées cliniquement. Évaluation de modèles fondateurs (Gemini, GPT-4.1 mini, Gemma-3) révèle performances substantiellement plus basses qu'en anglais, limitations sévères en raisonnement médical fin et diagnostic spécialisé.
Lire la source
Ton avis ?
BenchmarksVisionGeminiGPT

Résumé généré par Claude — vérifié par l'humain