Retour au feed
arXiv cs.LG·

Bounded Behavioral Indistinguishability for Black-Box LLM Distillation

Signal
72
Hype
18
En 3 lignesÉtude de la distillation de LLM en boîte noire via la notion de « bounded behavioral indistinguishability ». Les auteurs évaluent des paires Qwen et Llama avec une suite de 5 000 prompts, montrant que LoRA améliore la similarité sémantique (0.788→0.862 pour Qwen, 0.814→0.874 pour Llama) mais laisse subsister des différences comportementales détectables par adversaires.
Lire la source
Ton avis ?
Fine-tuningÉvaluationsSécurité IAQwenLlama

Résumé généré par Claude — vérifié par l'humain