arXiv cs.AI·19 mai 2026

On the Adversarial Robustness of Large Vision-Language Models under Visual Token Compression

Signal

Hype

En 3 lignesÉtude de la robustesse adversariale des modèles vision-langage compressés. Les auteurs proposent CAGE, une attaque qui exploite le décalage entre l'optimisation des perturbations (sur tokens complets) et l'inférence (via compression). CAGE combine disruption de features et alignement de distortion de rang pour révéler les vulnérabilités cachées des LVLMs compressés.

Lire la source

Ton avis ?

Vision Sécurité IA Benchmarks

Résumé généré par Claude — vérifié par l'humain

On the Adversarial Robustness of Large Vision-Language Models under Visual Token Compression

Autres angles sur ce sujet