Retour au feed
arXiv cs.CL·

EchoDistill:Alignment Noisy-to-Clean Self-Distillation for Robust Audio LLMs

Signal
78
Hype
15
En 3 lignesEchoDistill propose une méthode d'auto-distillation alignée pour renforcer la robustesse des modèles audio-LLM face au bruit. Un étudiant bruyant est optimisé via GRPO en utilisant un enseignant audio-propre comme référence sémantique. Résultats : +4.18% GSR sous bruit fort vs baseline, +3.02% Acc sur Qwen-Omni.
Lire la source
Ton avis ?
Reinforcement learningFine-tuning

Résumé généré par Claude — vérifié par l'humain