arXiv cs.CL·29 mai 2026

Transcribing Children's Speech: ASR Performance and Obtaining Reliable Orthographic Transcriptions

Signal

Hype

En 3 lignesÉtude comparative de 9 modèles ASR (Whisper, Parakeet, Wav2Vec2) sur la parole enfantine en néerlandais. Whisper-medium fine-tuné atteint 5,54% WER sur JASMIN et 70,37% sur DART. Une méthode de sélection au niveau des énoncés identifie 42% (JASMIN) et 18,1% (DART) des utterances comme correctement prononcées avec précision ≥98,3%, réduisant le besoin de vérification manuelle.

Lire la source

Ton avis ?

Benchmarks Voix Évaluations

Résumé généré par Claude — vérifié par l'humain

Transcribing Children's Speech: ASR Performance and Obtaining Reliable Orthographic Transcriptions

Autres angles sur ce sujet