VLM-AutoDrive: Post-Training Vision-Language Models for Safety-Critical Autonomous Driving Events
Signal
72
Hype
25
En 3 lignesVLM-AutoDrive est un framework de post-training pour adapter les Vision-Language Models à la détection d'anomalies critiques en conduite autonome. Sur des vidéos dashcam Nexar, le fine-tuning améliore le F1 de collision de 0.00 à 0.69 et la précision globale de 35.35% à 77.27% comparé à NVIDIA Cosmos-Reason1 7B en zero-shot.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain