Retour au feed
arXiv cs.AI·

PAREDA: A Multi-Accent Speech Dataset of Natural Language Processing Research Discussions

Signal
72
Hype
18
En 3 lignesPAREDA est un dataset de speech multi-accent (australien, indien, chinois) contenant des discussions spontanées sur des papers NLP. Les modèles ASR SOTA montrent une dégradation en zero-shot, mais le fine-tuning réduit significativement le WER, validant la richesse du corpus pour les systèmes ASR robustes.
Lire la source
Ton avis ?
BenchmarksVoixPapers

Résumé généré par Claude — vérifié par l'humain