Reasoning models struggle to control their chains of thought, and that’s good
Signal
72
Hype
28
En 3 lignesOpenAI présente CoT-Control, un outil mesurant la capacité des modèles de raisonnement à contrôler leurs chaînes de pensée. Les résultats montrent que ces modèles peinent à diriger leurs processus internes, renforçant l'importance de la monitorabilité comme garde-fou de sécurité IA.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain