Retour au feed
Hugging Face Blog·

What's going on with the Open LLM Leaderboard?

Signal
65
Hype
25
En 3 lignesHugging Face annonce des changements majeurs sur son Open LLM Leaderboard : révision des critères d'évaluation, amélioration de la transparence et de la reproductibilité des benchmarks. L'objectif est d'aligner le classement avec les besoins réels des utilisateurs et de réduire les gaming des scores.
Lire la source
Ton avis ?
BenchmarksOpen sourceÉvaluations

Résumé généré par Claude — vérifié par l'humain