Retour au feed
arXiv cs.LG·

In-Context Learning Operates as Concept Subspace Learning

Signal
82
Hype
15
En 3 lignesÉtude mécanistique de l'apprentissage en contexte (ICL) montrant que les démonstrations structurées induisent une inférence de concepts dans un sous-espace de faible dimension. Sur Llama-3-8B, un sous-espace de 68–73 dimensions sur 4096 restaure 78,8% de la performance, tandis que le sous-espace complémentaire n'a aucun effet. Résultats confirmés sur Qwen2.5-7B et tâches multilingues.
Lire la source
Ton avis ?
RaisonnementLlamaQwenPapers

Résumé généré par Claude — vérifié par l'humain