Retour au feed
arXiv cs.AI·

CAVE: A Structured Credit Assignment Approach for Fragmented Visual Evidence Reasoning

Signal
72
Hype
28
En 3 lignesCAVE est une méthode d'attribution de crédit basée sur GRPO pour améliorer le raisonnement visuel fragmenté dans les VLMs. Elle évalue les étapes intermédiaires via trois signaux : mise à jour des croyances, acquisition de preuves et contrôle adaptatif du focus. TRACER-Bench, un nouveau benchmark, évalue le raisonnement sur quatre dimensions non-locales et sémantiquement confusables.
Lire la source
Ton avis ?
VisionRaisonnementBenchmarksReinforcement learning

Résumé généré par Claude — vérifié par l'humain