Retour au feed
Hugging Face Blog·

Introducing the LiveCodeBench Leaderboard - Holistic and Contamination-Free Evaluation of Code LLMs

Signal
75
Hype
25
En 3 lignesHugging Face lance LiveCodeBench, un leaderboard d'évaluation pour les LLM de code. Il propose une évaluation holistique et sans contamination de données, avec des benchmarks régulièrement mis à jour pour éviter l'overfitting des modèles sur les données de test.
Lire la source
Ton avis ?
Génération de codeBenchmarksÉvaluationsOpen source

Résumé généré par Claude — vérifié par l'humain