Retour au feed
arXiv cs.CL·

Confidence Geometry Reveals Trace-Level Correctness in Large Language Model Reasoning

Signal
78
Hype
25
En 3 lignesLes trajectoires de confiance au niveau des tokens dans les LLM encodent des signaux géométriques liés à la correction des traces de raisonnement. Sans accès au texte ou aux états cachés, une représentation basse dimension sépare les traces correctes des incorrectes sur GSM8K, MATH et MMLU. NeuralConf, un estimateur léger, améliore l'agrégation pondérée par confiance par rapport au vote majoritaire.
Lire la source
Ton avis ?
RaisonnementÉvaluationsPapers

Résumé généré par Claude — vérifié par l'humain