Retour au feed
arXiv cs.AI·

Attention Hijacking: Response Manipulation Across Queries in Vision-Language Models

Signal
72
Hype
25
En 3 lignesAttention Hijacking : une attaque adversariale qui manipule les distributions d'attention internes des modèles vision-langage pour maintenir une réponse cible identique à travers différentes requêtes textuelles. La méthode amplifie l'influence des tokens visuels sur les tokens de réponse tout en supprimant celle des tokens textuels, améliorant la transférabilité cross-query.
Lire la source
Ton avis ?
VisionSécurité IAPapers

Résumé généré par Claude — vérifié par l'humain