Retour au feed
arXiv cs.AI·

Capability Self-Assessment: Teaching LLMs to Know Their Limits

Signal
78
Hype
22
En 3 lignesLes LLM modernes surestiment systématiquement leurs capacités et tentent de résoudre des requêtes impossibles. Des chercheurs proposent Capability Self-Assessment (CSA), formalisé comme un problème d'apprentissage par renforcement, pour enseigner aux modèles à reconnaître leurs limites. L'RL surpasse le fine-tuning supervisé, préserve les capacités originales et généralise hors-distribution.
Lire la source
Ton avis ?
Reinforcement learningAlignementÉvaluationsSécurité IA

Résumé généré par Claude — vérifié par l'humain