When Do LLMs Reason? A Dynamical Systems View via Entropy Phase Transitions
Signal
78
Hype
25
En 3 lignesÉtude montrant que le raisonnement explicite (CoT) n'est bénéfique que sur certaines tâches. Les auteurs proposent EDRM, un framework sans entraînement qui utilise la dynamique d'entropie en début de génération pour router adaptivement vers CoT ou inférence directe. Sur 15 benchmarks et 4 LLMs, EDRM réduit les tokens de 41–55% tout en améliorant la précision jusqu'à 4,7%.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain