arXiv cs.AI·19 mai 2026

PAREDA: A Multi-Accent Speech Dataset of Natural Language Processing Research Discussions

Signal

Hype

En 3 lignesPAREDA est un dataset de speech multi-accent (australien, indien, chinois) contenant des discussions spontanées sur des papers NLP. Les modèles ASR SOTA montrent une dégradation en zero-shot, mais le fine-tuning réduit significativement le WER, validant la richesse du corpus pour les systèmes ASR robustes.

Lire la source

Ton avis ?

Benchmarks Voix Papers

Résumé généré par Claude — vérifié par l'humain

PAREDA: A Multi-Accent Speech Dataset of Natural Language Processing Research Discussions

Autres angles sur ce sujet