arXiv cs.AI·27 mai 2026

A Dataset of Robot-Patient and Doctor-Patient Medical Dialogues for Spoken Language Processing Tasks

Signal

Hype

En 3 lignesMeDial-Speech : dataset de 111+ heures de dialogues médicaux parlés (robot-patient et médecin-patient) couvrant 4 conditions de santé. Benchmark de 3 LLMs (GPT-4 mini, DeepSeek-V3, Claude Sonnet 4) via sélection de phrases : Claude Sonnet 4 atteint 71,1% de précision. Révèle une surconfiance systématique des modèles.

Lire la source

Ton avis ?

Benchmarks Claude DeepSeek Voix

Résumé généré par Claude — vérifié par l'humain

A Dataset of Robot-Patient and Doctor-Patient Medical Dialogues for Spoken Language Processing Tasks

Autres angles sur ce sujet