arXiv cs.AI·25 mai 2026

MemAudit: Post-hoc Auditing of Poisoned Agent Memory via Causal Attribution and Structural Anomaly Detection

Signal

Hype

En 3 lignesMemAudit est un framework d'audit post-hoc pour détecter les mémoires empoisonnées dans les agents LLM. Il combine un score d'influence contrefactuelle et un graphe de cohérence mémoire pour identifier les enregistrements malveillants injectés via interactions normales. Évalué contre l'attaque MINJA, il réduit le taux de succès de 70% à 0% en QA et de 83,3% à 0% en reasoning.

Lire la source

Ton avis ?

Agents IA Sécurité IA RAG Papers

Résumé généré par Claude — vérifié par l'humain

MemAudit: Post-hoc Auditing of Poisoned Agent Memory via Causal Attribution and Structural Anomaly Detection

Autres angles sur ce sujet