Friends and Grandmothers in Silico: Localizing Entity Cells in Language Models
Signal
82
Hype
15
En 3 lignesChercheurs localisent des « cellules d'entité » dans les neurones MLP de modèles de langage (Qwen2.5-7B, etc.). Ces neurones activés de façon sélective encodent des faits spécifiques à une entité. Suppression d'une cellule efface le rappel pour cette entité seule ; activation suffit à récupérer la connaissance même sans contexte. Les cellules restent stables sous alias, acronymes et formes multilingues.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain