arXiv cs.LG·20 mai 2026

In-Context Learning Operates as Concept Subspace Learning

Signal

Hype

En 3 lignesÉtude mécanistique de l'apprentissage en contexte (ICL) montrant que les démonstrations structurées induisent une inférence de concepts dans un sous-espace de faible dimension. Sur Llama-3-8B, un sous-espace de 68–73 dimensions sur 4096 restaure 78,8% de la performance, tandis que le sous-espace complémentaire n'a aucun effet. Résultats confirmés sur Qwen2.5-7B et tâches multilingues.

Lire la source

Ton avis ?

Raisonnement Llama Qwen Papers

Résumé généré par Claude — vérifié par l'humain

In-Context Learning Operates as Concept Subspace Learning

Autres angles sur ce sujet