Retour au feed
arXiv cs.AI·

CounterCount: A Diagnostic Framework for Counting Bias in Vision Language Models

Signal
78
Hype
15
En 3 lignesCounterCount est un framework de diagnostic pour évaluer les biais de comptage dans les modèles vision-langage. Les tests révèlent que les VLMs performent bien sur des images factuelles mais dégradent significativement sur des images contrefactuelles où les attributs visuels contredisent les priors appris. Une stratégie de modulation d'attention au temps d'inférence améliore la précision jusqu'à 8%.
Lire la source
Ton avis ?
VisionÉvaluationsBenchmarksAlignement

Résumé généré par Claude — vérifié par l'humain