Retour au feed
arXiv cs.AI·

OmniVL-Guard Pro: A Tool-Augmented Agent for Omnibus Vision-Language Forensics

Signal
72
Hype
28
En 3 lignesOmniVL-Guard Pro est un agent augmenté d'outils pour la détection de contrefaçons vision-langage en monde ouvert. Il intègre recherche d'événements temps réel, détection de visages, extraction de frames vidéo et segmentation SAM3. Un dataset FSTR et un entraînement par RL supervisé (CGARL) améliorent le raisonnement multi-étapes.
Lire la source
Ton avis ?
Agents IAVisionRaisonnementReinforcement learningPapers

Résumé généré par Claude — vérifié par l'humain