OpenAI Blog·16 décembre 2025

Evaluating AI’s ability to perform scientific research tasks

Signal

Hype

En 3 lignesOpenAI lance FrontierScience, un benchmark évaluant les capacités de raisonnement des IA en physique, chimie et biologie. L'outil mesure la progression vers des tâches de recherche scientifique réelle. Pas de détails sur les résultats ou modèles testés fournis.

Lire la source

Ton avis ?

OpenAI Benchmarks Raisonnement

Résumé généré par Claude — vérifié par l'humain

Evaluating AI’s ability to perform scientific research tasks

Autres angles sur ce sujet