Retour au feed
arXiv cs.LG·

LLMs Show No Signs Of Individuated Metacognition

Signal
78
Hype
15
En 3 lignesAnalyse de 20 LLMs frontier sur 6 benchmarks : la confiance exprimée par les modèles ne reflète pas leurs capacités individuelles. Décomposition par analyse factorielle tétrachorique révèle une matrice de confiance de rang quasi-un. Les modèles partagent un axe de difficulté commune et diffèrent surtout par leurs seuils de décision. Aucune preuve de métacognition individuée verbalisée significative.
Lire la source
Ton avis ?
ÉvaluationsBenchmarksRaisonnement

Résumé généré par Claude — vérifié par l'humain