Retour au feed
arXiv cs.CL·

ESI-Bench: Towards Embodied Spatial Intelligence that Closes the Perception-Action Loop

Signal
72
Hype
25
En 3 lignesESI-Bench est un benchmark pour l'intelligence spatiale incarnée testant 10 catégories de tâches sur OmniGibson. Les expériences montrent que l'exploration active surpasse les approches passives, mais les modèles échouent principalement par « action blindness » : mauvais choix d'action → mauvaises observations → erreurs en cascade. Les modèles manquent de métacognition contrairement aux humains.
Lire la source
Ton avis ?
BenchmarksVisionRaisonnementRobotiquePapers

Résumé généré par Claude — vérifié par l'humain