Retour au feed
arXiv cs.CL·

Benchmarking Open-Source Safety Guard Models: A Comprehensive Evaluation

Signal
82
Hype
18
En 3 lignesÉvaluation de 14 modèles de sécurité open-source sur 79 331 échantillons couvrant 8 catégories de risque NIST. Qwen Guard (4B) atteint le meilleur recall (83,97%), surpassant Llama Guard (12B) et GPT-OSS Safeguard (20B). La taille du modèle ne corrèle pas avec la performance de détection.
Lire la source
Ton avis ?
BenchmarksSécurité IAOpen sourceQwenLlama

Résumé généré par Claude — vérifié par l'humain