One Mask to Rule Them All: On Hidden Facts after Editing and How to Find Them
Signal
75
Hype
15
En 3 lignesLes méthodes d'édition de connaissances ROME et MEMIT modifient les poids MLP des transformers. Les auteurs découvrent qu'elles ciblent un sous-ensemble commun de poids via un masque binaire qui annule 80% des édits en entraînement et 70% en test. Le mécanisme supprime plutôt que réécrit les connaissances, expliquant pourquoi les changements ne se propagent pas aux faits connexes.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain