Retour au feed
arXiv cs.AI·

When Is Rank-1 Steering Cheap? Geometry, Granularity, and Budgeted Search

Signal
78
Hype
15
En 3 lignesLes chercheurs formalisent le steering d'activation (contrôle d'LLM sans réentraînement) comme optimisation sous contrainte budgétaire. Ils introduisent la « granularité conceptuelle » pour expliquer pourquoi certains concepts sont coûteux à contrôler, et proposent GRACE, un framework qui utilise la géométrie d'activation pour diagnostiquer les difficultés et réduire de 39,8% les évaluations nécessaires.
Lire la source
Ton avis ?
RaisonnementAlignementPapers

Résumé généré par Claude — vérifié par l'humain