On the Adversarial Robustness of Large Vision-Language Models under Visual Token Compression
Signal
72
Hype
15
En 3 lignesÉtude de la robustesse adversariale des modèles vision-langage compressés. Les auteurs proposent CAGE, une attaque qui exploite le décalage entre l'optimisation des perturbations (sur tokens complets) et l'inférence (via compression). CAGE combine disruption de features et alignement de distortion de rang pour révéler les vulnérabilités cachées des LVLMs compressés.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain