Evaluating AI’s ability to perform scientific research tasks
Signal
72
Hype
35
En 3 lignesOpenAI lance FrontierScience, un benchmark évaluant les capacités de raisonnement des IA en physique, chimie et biologie. L'outil mesure la progression vers des tâches de recherche scientifique réelle. Pas de détails sur les résultats ou modèles testés fournis.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain