Retour au feed
arXiv cs.AI·

RoboMME: Benchmarking and Understanding Memory for Robotic Generalist Policies

Signal
75
Hype
20
En 3 lignesRoboMME est un benchmark standardisé pour évaluer la mémoire dans les modèles vision-langage-action (VLA) pour la manipulation robotique long-horizon. 16 tâches testent la mémoire temporelle, spatiale, d'objets et procédurale. 14 variantes VLA augmentées de mémoire construites sur π0.5 montrent que l'efficacité dépend fortement de la tâche.
Lire la source
Ton avis ?
RobotiqueVisionBenchmarksAgents IA

Résumé généré par Claude — vérifié par l'humain