GPT plus confiant sur les tâches difficiles où ils se trompe le plus, selon un preprint USC/Berkeley
Signal
72
Hype
35
En 3 lignesGPT-4o, ChatGPT et GPT-o3 affichent une confiance supérieure à leur précision réelle, particulièrement sur les tâches difficiles où ils commettent le plus d'erreurs. Un preprint USC/Berkeley révèle un écart croissant entre confiance déclarée et performance réelle.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain