arXiv cs.AI·19 mai 2026

RoboMME: Benchmarking and Understanding Memory for Robotic Generalist Policies

Signal

Hype

En 3 lignesRoboMME est un benchmark standardisé pour évaluer la mémoire dans les modèles vision-langage-action (VLA) pour la manipulation robotique long-horizon. 16 tâches testent la mémoire temporelle, spatiale, d'objets et procédurale. 14 variantes VLA augmentées de mémoire construites sur π0.5 montrent que l'efficacité dépend fortement de la tâche.

Lire la source

Ton avis ?

Robotique Vision Benchmarks Agents IA

Résumé généré par Claude — vérifié par l'humain

RoboMME: Benchmarking and Understanding Memory for Robotic Generalist Policies

Autres angles sur ce sujet