Analyzing Error Propagation in Korean Spoken QA with ASR-LLM Cascades
Signal
72
Hype
15
En 3 lignesÉtude de la propagation d'erreurs ASR dans les cascades ASR-LLM pour la compréhension orale en coréen. Les erreurs de reconnaissance vocale causent des défaillances sémantiques que les métriques ASR classiques ne capturent pas. Les erreurs d'un seul caractère en coréen créent un canal de défaillance distinct. Un modèle audio-langage large surpasse le pipeline ASR-LLM sur données bruitées.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain