Retour au feed
arXiv cs.CL·

LaSR: Context-Aware Speech Recognition via Latent Reasoning

Signal
72
Hype
28
En 3 lignesLaSR introduit un paradigme d'entraînement pour les Speech LLMs intégrant un raisonnement latent aligné sur les régions acoustiques. Sans tokens intermédiaires explicites, la méthode améliore la reconnaissance de vocabulaire spécialisé sur Fun-Audio-Chat. Un nouveau corpus Spoken Darwin-Science pour terminologies académiques est proposé.
Lire la source
Ton avis ?
VoixRaisonnementRAG

Résumé généré par Claude — vérifié par l'humain