A Paired Testing Protocol for Batch-Conditioned Refusal Robustness in LLM Serving
Signal
78
Hype
15
En 3 lignesÉtude arXiv sur la robustesse du refus des LLM en fonction de la configuration de batch. Protocole de test appairé sur 15 modèles révèle 0,16% de changements de label de sécurité authentiques. vLLM avec BATCH_INVARIANT=1 élimine les instabilités détectées (22→0 flips). Recommandation : valider le refus dans l'environnement de serving réel.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain