arXiv cs.CL·25 mai 2026

Sparse Autoencoders Map Brain-LLM Alignment onto Cortical Semantic Topography

Signal

Hype

En 3 lignesDes autoencodeurs creux (SAE) décomposent GPT-2 XL et Llama-3.1-8B en 16K-32K features interprétables par couche. Les features sémantiques seules récupèrent 94% de la performance d'encodage peak (r=0.285), et s'alignent avec l'organisation corticale sémantique connue (ρ=0.72, p<0.001). Les résultats généralisent sur l'anglais, le chinois et le français.

Lire la source

Ton avis ?

Papers GPT Llama Évaluations

Résumé généré par Claude — vérifié par l'humain

Sparse Autoencoders Map Brain-LLM Alignment onto Cortical Semantic Topography

Autres angles sur ce sujet