Retour au feed
arXiv cs.AI·

TRACE: Trajectory Risk-Aware Compression for Long-Horizon Agent Safety

Signal
72
Hype
25
En 3 lignesTRACE, une méthode de compression de trajectoires, détecte les risques de sécurité dans les agents LLM sur long horizon. Un Compresseur encode la trajectoire complète en état latent supervisé, tandis qu'un Reader juge la sécurité avec cette référence. Amélioration jusqu'à 12,6 points sur ASSEBench, Pre-Ex-Bench et R-Judge.
Lire la source
Ton avis ?
Agents IASécurité IARaisonnementPapers

Résumé généré par Claude — vérifié par l'humain