Every Eval Ever: A Unifying Schema and Community Repository for AI Evaluation Results
Signal
82
Hype
18
En 3 lignesEvery Eval Ever propose un schéma unifié et un dépôt communautaire pour standardiser les résultats d'évaluation IA. Le système ingère 22 235 modèles et 2 273 benchmarks via un format JSON unique, avec convertisseurs automatiques depuis les harnesses populaires et leaderboards. Résout la fragmentation des résultats dispersés en formats incompatibles.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain