arXiv cs.AI·19 mai 2026

Self-Evolving Spatial Reasoning in Vision Language Models via Geometric Logic Consistency

Signal

Hype

En 3 lignesSAGE, un framework d'auto-évolution, améliore le raisonnement spatial des VLMs en appliquant une cohérence logique via des opérations géométriques et linguistiques. Intégré comme étape de post-training GRPO légère, il corrige les incohérences sous transformations prédictibles et montre des gains sur benchmarks vidéo et spatial.

Lire la source

Ton avis ?

Vision Raisonnement Reinforcement learning

Résumé généré par Claude — vérifié par l'humain

Self-Evolving Spatial Reasoning in Vision Language Models via Geometric Logic Consistency

Autres angles sur ce sujet