arXiv cs.AI·2 juin 2026

Capability Self-Assessment: Teaching LLMs to Know Their Limits

Signal

Hype

En 3 lignesLes LLM modernes surestiment systématiquement leurs capacités et tentent de résoudre des requêtes impossibles. Des chercheurs proposent Capability Self-Assessment (CSA), formalisé comme un problème d'apprentissage par renforcement, pour enseigner aux modèles à reconnaître leurs limites. L'RL surpasse le fine-tuning supervisé, préserve les capacités originales et généralise hors-distribution.

Lire la source

Ton avis ?

Reinforcement learning Alignement Évaluations Sécurité IA

Résumé généré par Claude — vérifié par l'humain

Capability Self-Assessment: Teaching LLMs to Know Their Limits

Autres angles sur ce sujet