Composition Collapse: Stable Factual Knowledge Does Not Imply Compositional Reasoning
Signal
78
Hype
15
En 3 lignesUne étude arXiv montre que les modèles avec des connaissances factuelles stables échouent systématiquement à les assembler en chaînes de raisonnement multi-hop (écart >40 points). Les métriques agrégées masquent ce « composition collapse ». Les auteurs proposent un protocole double-gate pour décomposer les gains post-training en trois canaux : stabilité atomique, composition résiduelle et profondeur critique.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain