ESI-Bench: Towards Embodied Spatial Intelligence that Closes the Perception-Action Loop
Signal
72
Hype
25
En 3 lignesESI-Bench est un benchmark pour l'intelligence spatiale incarnée testant 10 catégories de tâches sur OmniGibson. Les expériences montrent que l'exploration active surpasse les approches passives, mais les modèles échouent principalement par « action blindness » : mauvais choix d'action → mauvaises observations → erreurs en cascade. Les modèles manquent de métacognition contrairement aux humains.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain