Are Multimodal LLMs Ready for Surveillance? A Reality Check on Zero-Shot Anomaly Detection in the Wild
Signal
72
Hype
25
En 3 lignesÉtude systématique de modèles multimodaux (MLLMs) sur la détection d'anomalies vidéo (VAD) avec les benchmarks ShanghaiTech et CHAD. Les modèles montrent un biais conservateur en zéro-shot : haute précision mais effondrement du recall. Instructions spécifiques améliorent F1 de 0,09 à 0,64, mais le recall reste critique pour la surveillance réelle.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain