DenseSteer: Steering Small Language Models towards Dense Math Reasoning
Signal
72
Hype
25
En 3 lignesDenseSteer est une méthode d'inférence sans entraînement qui améliore le raisonnement mathématique des petits modèles (≤3B paramètres) en modulant leurs représentations internes vers des patterns de raisonnement dense. Sur Qwen-2.5, l'approche montre que un raisonnement plus efficace utilise moins d'étapes mais avec une densité informationnelle plus élevée.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain