Retour au feed
arXiv cs.CL·

Can LLMs Refuse Questions They Do Not Know? Measuring Knowledge-Aware Refusal in Factual Tasks

Signal
78
Hype
15
En 3 lignesChercheurs proposent l'Indice de Refus (RI), métrique mesurant la capacité des LLM à refuser les questions hors de leurs connaissances. RI corrèle la probabilité de refus avec la probabilité d'erreur via Spearman. Tests sur 16 modèles et 5 datasets montrent que les LLM refusent de façon instable malgré une haute précision factuelle.
Lire la source
Ton avis ?
ÉvaluationsSécurité IAAlignementBenchmarks

Résumé généré par Claude — vérifié par l'humain