Retour au feed
Reddit r/MachineLearning·

Verbosity is not faithfulness: an architectural argument that reasoning models cannot perform faithful inference [D]

Signal
45
Hype
25
En 3 lignesUn essai argue que les modèles de raisonnement ne peuvent pas effectuer une inférence fidèle car leur trace de raisonnement et réponse finale proviennent de la même opération. Critique empirique des travaux de Lanham/Turpin/Mirzadeh, comparaison avec HRM, TRM, GRAM, AlphaProof et Kona/Aleph.
Lire la source
Ton avis ?
RaisonnementAlignementPapers

Résumé généré par Claude — vérifié par l'humain