Direct Preference Optimization for English-Mandarin Code-Switching Speech Recognition in Audio LLMs
Signal
78
Hype
15
En 3 lignesDes chercheurs appliquent Direct Preference Optimization (DPO) pour améliorer la transcription code-switching anglais-mandarin dans les Audio LLMs. Trois modes d'échec identifiés : omission de langue, traduction au lieu de transcription, hallucination. Entraînement sur 100K paires (570 heures) réduit le MER jusqu'à 89,6% (in-distribution) et 20,0% (out-of-distribution).Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain