arXiv cs.CL·2 juin 2026

LaSR: Context-Aware Speech Recognition via Latent Reasoning

Signal

Hype

En 3 lignesLaSR introduit un paradigme d'entraînement pour les Speech LLMs intégrant un raisonnement latent aligné sur les régions acoustiques. Sans tokens intermédiaires explicites, la méthode améliore la reconnaissance de vocabulaire spécialisé sur Fun-Audio-Chat. Un nouveau corpus Spoken Darwin-Science pour terminologies académiques est proposé.

Lire la source

Ton avis ?

Voix Raisonnement RAG

Résumé généré par Claude — vérifié par l'humain

LaSR: Context-Aware Speech Recognition via Latent Reasoning

Autres angles sur ce sujet