arXiv cs.CL·19 mai 2026

How Good LLMs Are at Answering Bangla Medical Visual Questions? Dataset and Benchmarking

Signal

Hype

En 3 lignesBanglaMedVQA : nouveau benchmark de questions visuelles médicales en bengali avec paires image-question-réponse validées cliniquement. Évaluation de modèles fondateurs (Gemini, GPT-4.1 mini, Gemma-3) révèle performances substantiellement plus basses qu'en anglais, limitations sévères en raisonnement médical fin et diagnostic spécialisé.

Lire la source

Ton avis ?

Benchmarks Vision Gemini GPT

Résumé généré par Claude — vérifié par l'humain

How Good LLMs Are at Answering Bangla Medical Visual Questions? Dataset and Benchmarking

Autres angles sur ce sujet