arXiv cs.CL·20 mai 2026

FormalASR: End-to-End Spoken Chinese to Formal Text

Signal

Hype

En 3 lignesFormalASR propose deux modèles compacts (0.6B et 1.7B paramètres) qui transcrivent directement le chinois parlé en texte formel écrit, sans pipeline ASR+LLM. Entraînés sur WenetSpeech-Formal et Speechio-Formal via fine-tuning supervisé de Qwen3-ASR, ils réduisent le CER de 37.4% par rapport aux baselines verbatim et améliorent ROUGE-L et BERTScore.

Lire la source

Ton avis ?

Qwen Génération de code Fine-tuning Benchmarks

Résumé généré par Claude — vérifié par l'humain

FormalASR: End-to-End Spoken Chinese to Formal Text

Autres angles sur ce sujet