Retour au feed
arXiv cs.AI·

Every Eval Ever: A Unifying Schema and Community Repository for AI Evaluation Results

Signal
82
Hype
18
En 3 lignesEvery Eval Ever propose un schéma unifié et un dépôt communautaire pour standardiser les résultats d'évaluation IA. Le système ingère 22 235 modèles et 2 273 benchmarks via un format JSON unique, avec convertisseurs automatiques depuis les harnesses populaires et leaderboards. Résout la fragmentation des résultats dispersés en formats incompatibles.
Lire la source
Ton avis ?
ÉvaluationsBenchmarksOpen sourceInfrastructure

Résumé généré par Claude — vérifié par l'humain