Hidden Thoughts Are Not Secret: Reasoning Trace Exposure in LLMs
Signal
75
Hype
35
En 3 lignesDes chercheurs montrent que les traces de raisonnement cachées des LLM peuvent être extraites via Reasoning Exposure Prompting (REP), une méthode de prompting légère utilisant des démonstrations générées par modèles fantômes. REP expose les traces internes même quand les systèmes déployés les masquent intentionnellement, préservant les signaux de raisonnement utiles pour la distillation.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain