Retour au feed
arXiv cs.AI·

Friends and Grandmothers in Silico: Localizing Entity Cells in Language Models

Signal
82
Hype
15
En 3 lignesChercheurs localisent des « cellules d'entité » — neurones MLP sélectifs qui encodent des faits spécifiques — dans sept modèles de langage. Sur Qwen2.5-7B, supprimer une cellule efface le rappel pour son entité tandis qu'activer une seule cellule suffit à récupérer la connaissance, même sans contexte. Ces cellules restent stables sous alias, acronymes et formes multilingues.
Lire la source
Ton avis ?
Benchmarks

Résumé généré par Claude — vérifié par l'humain