Sparse Autoencoders Map Brain-LLM Alignment onto Cortical Semantic Topography
Signal
82
Hype
15
En 3 lignesDes autoencodeurs creux (SAE) décomposent GPT-2 XL et Llama-3.1-8B en 16K-32K features interprétables par couche. Les features sémantiques seules récupèrent 94% de la performance d'encodage peak (r=0.285), et s'alignent avec l'organisation corticale sémantique connue (ρ=0.72, p<0.001). Les résultats généralisent sur l'anglais, le chinois et le français.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain