Raon-Speech Technical Report
Signal
82
Hype
25
En 3 lignesRaon-Speech est un modèle de langage parlé 9B multilingue (anglais/coréen) capable de comprendre et générer la parole tout en préservant les capacités textuelles. Entraîné sur 1,38M heures de données, il surpasse 8 modèles audio comparables (Qwen2.5-Omni, Fun-Audio-Chat) sur 42 benchmarks. Raon-SpeechChat ajoute la conversation full-duplex temps réel via 119K heures de dialogue.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain