arXiv cs.AI·19 mai 2026

CAVE: A Structured Credit Assignment Approach for Fragmented Visual Evidence Reasoning

Signal

Hype

En 3 lignesCAVE est une méthode d'attribution de crédit basée sur GRPO pour améliorer le raisonnement visuel fragmenté dans les VLMs. Elle évalue les étapes intermédiaires via trois signaux : mise à jour des croyances, acquisition de preuves et contrôle adaptatif du focus. TRACER-Bench, un nouveau benchmark, évalue le raisonnement sur quatre dimensions non-locales et sémantiquement confusables.

Lire la source

Ton avis ?

Vision Raisonnement Benchmarks Reinforcement learning

Résumé généré par Claude — vérifié par l'humain

CAVE: A Structured Credit Assignment Approach for Fragmented Visual Evidence Reasoning

Autres angles sur ce sujet