Benchmarking Open-Source Safety Guard Models: A Comprehensive Evaluation
Signal
82
Hype
18
En 3 lignesÉvaluation de 14 modèles de sécurité open-source sur 79 331 échantillons couvrant 8 catégories de risque NIST. Qwen Guard (4B) atteint le meilleur recall (83,97%), surpassant Llama Guard (12B) et GPT-OSS Safeguard (20B). La taille du modèle ne corrèle pas avec la performance de détection.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain