Retour au feed
arXiv cs.AI·

ASPI: Seeking Ambiguity Clarification Amplifies Prompt Injection Vulnerability in LLM Agents

Signal
82
Hype
25
En 3 lignesASPI est un benchmark de 728 scénarios tâche-attaque mesurant comment la clarification augmente la vulnérabilité aux injections de prompt. Les tests sur 10 LLMs frontière montrent que le taux de succès d'attaque monte de 1,8% à 34,0% pour o3 et de 2,2% à 35,7% pour Gemini-3-Flash en mode clarification. Code et données disponibles.
Lire la source
Ton avis ?
Agents IASécurité IABenchmarksPrompt engineering

Résumé généré par Claude — vérifié par l'humain