arXiv cs.AI·19 mai 2026

VLM-AutoDrive: Post-Training Vision-Language Models for Safety-Critical Autonomous Driving Events

Signal

Hype

En 3 lignesVLM-AutoDrive est un framework de post-training pour adapter les Vision-Language Models à la détection d'anomalies critiques en conduite autonome. Sur des vidéos dashcam Nexar, le fine-tuning améliore le F1 de collision de 0.00 à 0.69 et la précision globale de 35.35% à 77.27% comparé à NVIDIA Cosmos-Reason1 7B en zero-shot.

Lire la source

Ton avis ?

Vision Fine-tuning Raisonnement Sécurité IA Papers

Résumé généré par Claude — vérifié par l'humain

VLM-AutoDrive: Post-Training Vision-Language Models for Safety-Critical Autonomous Driving Events

Autres angles sur ce sujet