arXiv cs.AI·19 mai 2026

Attention Hijacking: Response Manipulation Across Queries in Vision-Language Models

Signal

Hype

En 3 lignesAttention Hijacking : une attaque adversariale qui manipule les distributions d'attention internes des modèles vision-langage pour maintenir une réponse cible identique à travers différentes requêtes textuelles. La méthode amplifie l'influence des tokens visuels sur les tokens de réponse tout en supprimant celle des tokens textuels, améliorant la transférabilité cross-query.

Lire la source

Ton avis ?

Vision Sécurité IA Papers

Résumé généré par Claude — vérifié par l'humain

Attention Hijacking: Response Manipulation Across Queries in Vision-Language Models

Autres angles sur ce sujet