The Readout Shortcut: Positional Number Copying Dominates Arithmetic CoT Readout in Small Language Models
Signal
78
Hype
15
En 3 lignesSur des modèles 1-3B, le CoT en arithmétique repose sur un raccourci positionnel : le modèle copie simplement le nombre en dernière position avant le délimiteur de réponse, indépendamment du raisonnement intermédiaire. Cette stratégie explique 54-92 pp de précision sur GSM8K. Remplacer ce nombre par une valeur incorrecte effondre la performance même avec des étapes correctes.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain