Retour au feed
Hugging Face Blog·

BigCodeBench: The Next Generation of HumanEval

Signal
75
Hype
25
En 3 lignesHugging Face présente BigCodeBench, un benchmark de nouvelle génération pour l'évaluation des modèles de code. Il succède à HumanEval avec une couverture étendue et des métriques améliorées pour mesurer les capacités de génération de code.
Lire la source
Ton avis ?
BenchmarksGénération de codeOpen source

Résumé généré par Claude — vérifié par l'humain