arXiv cs.CL·28 mai 2026

Syllabic-Structure Decoder for Automatic Speech Recognition in Vietnamese

Signal

Hype

En 3 lignesNouvelle approche ASR pour le vietnamien basée sur une décodage syllabique phonémique. Le modèle capture la structure phonologique des syllabes plutôt que les unités orthographiques, réduisant la taille du vocabulaire. Résultats supérieurs sur LSVSC et UIT-ViMD face à PhoWhisper et Wav2Vec2.

Lire la source

Ton avis ?

Voix Benchmarks Papers

Résumé généré par Claude — vérifié par l'humain

Syllabic-Structure Decoder for Automatic Speech Recognition in Vietnamese

Autres angles sur ce sujet