Retour au feed
arXiv cs.AI·

Are Multimodal LLMs Ready for Surveillance? A Reality Check on Zero-Shot Anomaly Detection in the Wild

Signal
72
Hype
25
En 3 lignesÉtude systématique de modèles multimodaux (MLLMs) sur la détection d'anomalies vidéo (VAD) avec les benchmarks ShanghaiTech et CHAD. Les modèles montrent un biais conservateur en zéro-shot : haute précision mais effondrement du recall. Instructions spécifiques améliorent F1 de 0,09 à 0,64, mais le recall reste critique pour la surveillance réelle.
Lire la source
Ton avis ?
VisionRaisonnementPrompt engineeringBenchmarksÉvaluations

Résumé généré par Claude — vérifié par l'humain