Retour au feed
arXiv cs.LG·

The Readout Shortcut: Positional Number Copying Dominates Arithmetic CoT Readout in Small Language Models

Signal
78
Hype
15
En 3 lignesSur des modèles 1-3B, le CoT en arithmétique repose sur un raccourci positionnel : le modèle copie simplement le nombre en dernière position avant le délimiteur de réponse, indépendamment du raisonnement intermédiaire. Cette stratégie explique 54-92 pp de précision sur GSM8K. Remplacer ce nombre par une valeur incorrecte effondre la performance même avec des étapes correctes.
Lire la source
Ton avis ?
RaisonnementÉvaluationsBenchmarks

Résumé généré par Claude — vérifié par l'humain