EHRBench: An Automated and Reliable EHR-based Benchmark for Clinical Decision Making with LLMs
Signal
78
Hype
25
En 3 lignesEHRBench est un benchmark automatisé et fiable pour évaluer les LLMs sur des tâches de prise de décision clinique. Construit via un pipeline EHR-LLM-KB, il génère ~960k items QA couvrant diagnostic, traitement et pronostic. 30+ LLMs benchmarkés révèlent des lacunes persistantes vers la fiabilité clinique.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain