Retour au feed
arXiv cs.AI·

NavOne: One-Step Global Planning for Vision-Language Navigation on Top-Down Maps

Signal
75
Hype
25
En 3 lignesNavOne reformule la navigation vision-langage (VLN) comme un problème de planification globale en une seule étape sur des cartes top-down. Le framework prédit directement les probabilités de chemin denses via un passage forward unique, avec un accélérateur de 8x vs méthodes basées cartes et 80x vs méthodes égocentristes. Nouvel ensemble R2R-TopDown.
Lire la source
Ton avis ?
VisionRaisonnementBenchmarks

Résumé généré par Claude — vérifié par l'humain