arXiv cs.AI·1 juin 2026

COMPASS: Cognitive MCTS-Guided Process Alignment for Safe Search Agents

Signal

Hype

En 3 lignesCOMPASS est un framework d'alignement de sécurité pour agents de recherche LLM multi-étapes. Il combine l'exploration d'arbres cognitifs (CTE) pour synthétiser des trajectoires d'attaque et l'alignement introspectif (ISA) pour superviser les actions intermédiaires risquées. Résultats : meilleur compromis sécurité-utilité avec moins de données d'entraînement.

Lire la source

Ton avis ?

Agents IA Sécurité IA Alignement Raisonnement

Résumé généré par Claude — vérifié par l'humain

COMPASS: Cognitive MCTS-Guided Process Alignment for Safe Search Agents

Autres angles sur ce sujet