arXiv cs.CL·26 mai 2026

EchoDistill:Alignment Noisy-to-Clean Self-Distillation for Robust Audio LLMs

Signal

Hype

En 3 lignesEchoDistill propose une méthode d'auto-distillation alignée pour renforcer la robustesse des modèles audio-LLM face au bruit. Un étudiant bruyant est optimisé via GRPO en utilisant un enseignant audio-propre comme référence sémantique. Résultats : +4.18% GSR sous bruit fort vs baseline, +3.02% Acc sur Qwen-Omni.

Lire la source

Ton avis ?

Reinforcement learning Fine-tuning

Résumé généré par Claude — vérifié par l'humain

EchoDistill:Alignment Noisy-to-Clean Self-Distillation for Robust Audio LLMs

Autres angles sur ce sujet