arXiv cs.LG·25 mai 2026

When Do LLMs Reason? A Dynamical Systems View via Entropy Phase Transitions

Signal

Hype

En 3 lignesÉtude montrant que le raisonnement explicite (CoT) n'est bénéfique que sur certaines tâches. Les auteurs proposent EDRM, un framework sans entraînement qui utilise la dynamique d'entropie en début de génération pour router adaptivement vers CoT ou inférence directe. Sur 15 benchmarks et 4 LLMs, EDRM réduit les tokens de 41–55% tout en améliorant la précision jusqu'à 4,7%.

Lire la source

Ton avis ?

Raisonnement Évaluations Benchmarks

Résumé généré par Claude — vérifié par l'humain

When Do LLMs Reason? A Dynamical Systems View via Entropy Phase Transitions

Autres angles sur ce sujet