BigCodeBench: The Next Generation of HumanEval
Signal
75
Hype
25
En 3 lignesHugging Face présente BigCodeBench, un benchmark de nouvelle génération pour l'évaluation des modèles de code. Il succède à HumanEval avec une couverture étendue et des métriques améliorées pour mesurer les capacités de génération de code.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain