Retour au feed
arXiv cs.AI·

LLM-Safety Evaluations Lack Robustness

Signal
75
Hype
15
En 3 lignesÉtude arXiv montrant que les évaluations de sécurité des LLM souffrent de bruit systématique : petits datasets, incohérences méthodologiques, configurations d'évaluation peu fiables. Analyse du pipeline complet (curation, red-teaming automatisé, génération, jugement par LLM) et propose des lignes directrices pour réduire le biais.
Lire la source
Ton avis ?
Sécurité IAAlignementÉvaluationsPapers

Résumé généré par Claude — vérifié par l'humain