ActuIA·26 mai 2026

GPT plus confiant sur les tâches difficiles où ils se trompe le plus, selon un preprint USC/Berkeley

Signal

Hype

En 3 lignesGPT-4o, ChatGPT et GPT-o3 affichent une confiance supérieure à leur précision réelle, particulièrement sur les tâches difficiles où ils commettent le plus d'erreurs. Un preprint USC/Berkeley révèle un écart croissant entre confiance déclarée et performance réelle.

Lire la source

Ton avis ?

GPT OpenAI Évaluations Sécurité IA Papers

Résumé généré par Claude — vérifié par l'humain

GPT plus confiant sur les tâches difficiles où ils se trompe le plus, selon un preprint USC/Berkeley

Autres angles sur ce sujet