PAREDA: A Multi-Accent Speech Dataset of Natural Language Processing Research Discussions
Signal
72
Hype
18
En 3 lignesPAREDA est un dataset de speech multi-accent (australien, indien, chinois) contenant des discussions spontanées sur des papers NLP. Les modèles ASR SOTA montrent une dégradation en zero-shot, mais le fine-tuning réduit significativement le WER, validant la richesse du corpus pour les systèmes ASR robustes.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain