arXiv cs.AI·19 mai 2026

CounterCount: A Diagnostic Framework for Counting Bias in Vision Language Models

Signal

Hype

En 3 lignesCounterCount est un framework de diagnostic pour évaluer les biais de comptage dans les modèles vision-langage. Les tests révèlent que les VLMs performent bien sur des images factuelles mais dégradent significativement sur des images contrefactuelles où les attributs visuels contredisent les priors appris. Une stratégie de modulation d'attention au temps d'inférence améliore la précision jusqu'à 8%.

Lire la source

Ton avis ?

Vision Évaluations Benchmarks Alignement

Résumé généré par Claude — vérifié par l'humain

CounterCount: A Diagnostic Framework for Counting Bias in Vision Language Models

Autres angles sur ce sujet