Retour au feed
OpenAI Blog·

Evaluating AI’s ability to perform scientific research tasks

Signal
72
Hype
35
En 3 lignesOpenAI lance FrontierScience, un benchmark évaluant les capacités de raisonnement des IA en physique, chimie et biologie. L'outil mesure la progression vers des tâches de recherche scientifique réelle. Pas de détails sur les résultats ou modèles testés fournis.
Lire la source
Ton avis ?
OpenAIBenchmarksRaisonnement

Résumé généré par Claude — vérifié par l'humain