FormalASR: End-to-End Spoken Chinese to Formal Text
Signal
75
Hype
15
En 3 lignesFormalASR propose deux modèles compacts (0.6B et 1.7B paramètres) qui transcrivent directement le chinois parlé en texte formel écrit, sans pipeline ASR+LLM. Entraînés sur WenetSpeech-Formal et Speechio-Formal via fine-tuning supervisé de Qwen3-ASR, ils réduisent le CER de 37.4% par rapport aux baselines verbatim et améliorent ROUGE-L et BERTScore.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain