Real-time multilingual ASR using rolling buffers and monolingual models [P]
Signal
78
Hype
25
En 3 lignesSystème ASR multilingue temps réel utilisant un routage entre modèles monolingues spécialisés (~100M paramètres chacun) plutôt qu'un seul modèle massif. Détecte les changements de langue via SpeechBrain et re-transcrit avec le bon modèle. Atteint 13% WER sur code-switching inter-énoncé, surpassant les APIs cloud. Repo open-source disponible.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain