Effort as Ceiling, Not Dial: Reasoning Budget Does Not Modulate Cognitive Cost Alignment Between Humans and Large Reasoning Models
Signal
72
Hype
15
En 3 lignesLes grands modèles de raisonnement (LRM) génèrent des traces alignées avec les temps de réaction humains, mais cet alignement persiste indépendamment du budget de raisonnement en inférence. Étude sur GPT-OSS-20B et GPT-OSS-120B : l'allocation de tokens suit les patterns de difficulté humains et reste invariante across effort levels, suggérant que l'alignement cognitif est figé au training time.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain