Retour au feed
arXiv cs.CL·

Language models struggle with compartmentalization

Signal
75
Hype
15
En 3 lignesLes LLM échouent à identifier et partager la force statistique entre différentes présentations du même concept (même fait en anglais et swahili, fonctions en Python et Haskell). Ils créent des représentations internes parallèles redondantes, saturant la capacité du modèle. Les petits modèles montrent une compartimentation quasi-totale en apprentissage multilingue précoce.
Lire la source
Ton avis ?
PapersRaisonnementÉvaluations

Résumé généré par Claude — vérifié par l'humain