Retour au feed
arXiv cs.AI·

LightZeroNav: Zero-Shot Vision Language Navigation in Continuous Environments Based on Lightweight VLMs

Signal
72
Hype
35
En 3 lignesLightZeroNav résout la navigation vision-langage zéro-shot en environnements continus avec des VLMs légers. Basé sur Qwen3-VL-8B, le système gère la redondance informationnelle, l'estimation de progression et l'enchevêtrement des tâches. Performance comparable à GPT-4o sans entraînement spécifique ni prédicteurs de waypoints.
Lire la source
Ton avis ?
VisionQwenRaisonnementAgents IAPapers

Résumé généré par Claude — vérifié par l'humain