Retour au feed
arXiv cs.CL·

Monitoring the Internal Monologue: Probe Trajectories Reveal Reasoning Dynamics

Signal
78
Hype
15
En 3 lignesÉtude des représentations internes des Large Reasoning Models (LRMs) via des trajectoires de probes. Les auteurs montrent que l'évolution continue d'un concept pendant le raisonnement prédit mieux le comportement final que des prédictions statiques. Max-pooling atteint 95% AUROC sur 4 datasets (sécurité, mathématiques).
Lire la source
Ton avis ?
RaisonnementSécurité IAÉvaluations

Résumé généré par Claude — vérifié par l'humain