Retour au feed
arXiv cs.AI·

Event-Grounded Sparse Autoencoders for Vision-Language-Action Policies

Signal
72
Hype
18
En 3 lignesNouvelle approche d'interprétabilité mécanique pour les politiques Vision-Langue-Action (VLA) robotiques. Les auteurs proposent des autoencodeurs creux (SAE) ancrés à des événements comportementaux plutôt qu'à des contextes textuels. Évaluation sur OpenVLA et π₀.₅ en simulation et robot réel, avec code disponible.
Lire la source
Ton avis ?
VisionRobotiqueAgents IAPapers

Résumé généré par Claude — vérifié par l'humain