Retour au feed
OpenAI Blog·

Introducing HealthBench

Signal
72
Hype
28
En 3 lignesOpenAI lance HealthBench, un benchmark d'évaluation pour l'IA en santé conçu avec 250+ médecins. Évalue les modèles sur des scénarios réalistes et établit un standard partagé de performance et sécurité.
Lire la source
Ton avis ?
OpenAIBenchmarksSécurité IAÉvaluations

Résumé généré par Claude — vérifié par l'humain