arXiv cs.CL·19 mai 2026

Confidence Geometry Reveals Trace-Level Correctness in Large Language Model Reasoning

Signal

Hype

En 3 lignesLes trajectoires de confiance au niveau des tokens dans les LLM encodent des signaux géométriques liés à la correction des traces de raisonnement. Sans accès au texte ou aux états cachés, une représentation basse dimension sépare les traces correctes des incorrectes sur GSM8K, MATH et MMLU. NeuralConf, un estimateur léger, améliore l'agrégation pondérée par confiance par rapport au vote majoritaire.

Lire la source

Ton avis ?

Raisonnement Évaluations Papers

Résumé généré par Claude — vérifié par l'humain

Confidence Geometry Reveals Trace-Level Correctness in Large Language Model Reasoning

Autres angles sur ce sujet