arXiv cs.CL·21 mai 2026

Synchronization and Turn-Taking in Full-Duplex Speech Dialogue Models

Signal

Hype

En 3 lignesÉtude de la synchronisation dans les modèles de dialogue full-duplex (Moshi) qui écoutent et parlent simultanément. Les chercheurs mesurent l'alignement des représentations internes via CKA et détectent des signaux anticipatoires de prise de parole. La synchronisation est forte sans bruit, se dégrade avec le bruit, et les états internes encodent des informations prédictives.

Lire la source

Ton avis ?

Voix Agents IA Papers Raisonnement

Résumé généré par Claude — vérifié par l'humain

Synchronization and Turn-Taking in Full-Duplex Speech Dialogue Models

Autres angles sur ce sujet