Retour au feed
Google DeepMind·

Rethinking how we measure AI intelligence

Signal
72
Hype
28
En 3 lignesGoogle DeepMind lance Game Arena, une plateforme open-source pour évaluer rigoureusement les modèles IA via des comparaisons directes dans des environnements avec conditions de victoire claires.
Lire la source
Ton avis ?
DeepMindÉvaluationsBenchmarksOpen source

Résumé généré par Claude — vérifié par l'humain