Retour au feed
arXiv cs.CL·

BayLing-Duplex: Native Full-Duplex Speech Dialogue with a Single Autoregressive LLM

Signal
78
Hype
25
En 3 lignesBayLing-Duplex est un modèle de langage parlé full-duplex natif basé sur un LLM autorégressif unique, sans module VAD externe. Entraîné sur 400K échantillons avec fine-tuning et DPO, il atteint 92% de succès en gestion des tours et 100% en interruptions sur InstructS2S-Eval, améliorant le score de réponse vocale de 2,17 à 3,39 par rapport à Moshi.
Lire la source
Ton avis ?
VoixAgents IABenchmarksDeepMind

Résumé généré par Claude — vérifié par l'humain