Retour au feed
arXiv cs.AI·

MemAudit: Post-hoc Auditing of Poisoned Agent Memory via Causal Attribution and Structural Anomaly Detection

Signal
78
Hype
25
En 3 lignesMemAudit est un framework d'audit post-hoc pour détecter les mémoires empoisonnées dans les agents LLM. Il combine un score d'influence contrefactuelle et un graphe de cohérence mémoire pour identifier les enregistrements malveillants injectés via interactions normales. Évalué contre l'attaque MINJA, il réduit le taux de succès de 70% à 0% en QA et de 83,3% à 0% en reasoning.
Lire la source
Ton avis ?
Agents IASécurité IARAGPapers

Résumé généré par Claude — vérifié par l'humain