Retour au feed
arXiv cs.CL·

Syllabic-Structure Decoder for Automatic Speech Recognition in Vietnamese

Signal
72
Hype
15
En 3 lignesNouvelle approche ASR pour le vietnamien basée sur une décodage syllabique phonémique. Le modèle capture la structure phonologique des syllabes plutôt que les unités orthographiques, réduisant la taille du vocabulaire. Résultats supérieurs sur LSVSC et UIT-ViMD face à PhoWhisper et Wav2Vec2.
Lire la source
Ton avis ?
VoixBenchmarksPapers

Résumé généré par Claude — vérifié par l'humain