LLM-Safety Evaluations Lack Robustness
Signal
75
Hype
15
En 3 lignesÉtude arXiv montrant que les évaluations de sécurité des LLM souffrent de bruit systématique : petits datasets, incohérences méthodologiques, configurations d'évaluation peu fiables. Analyse du pipeline complet (curation, red-teaming automatisé, génération, jugement par LLM) et propose des lignes directrices pour réduire le biais.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain