Transcribing Children's Speech: ASR Performance and Obtaining Reliable Orthographic Transcriptions
Signal
72
Hype
15
En 3 lignesÉtude comparative de 9 modèles ASR (Whisper, Parakeet, Wav2Vec2) sur la parole enfantine en néerlandais. Whisper-medium fine-tuné atteint 5,54% WER sur JASMIN et 70,37% sur DART. Une méthode de sélection au niveau des énoncés identifie 42% (JASMIN) et 18,1% (DART) des utterances comme correctement prononcées avec précision ≥98,3%, réduisant le besoin de vérification manuelle.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain