Retour au feed
OpenAI Blog·

Evaluating large language models trained on code

Signal
65
Hype
25
En 3 lignesOpenAI publie une méthode d'évaluation pour les modèles de langage entraînés sur du code. L'étude propose des benchmarks et des critères pour mesurer la qualité et la performance des modèles de génération de code.
Lire la source
Ton avis ?
OpenAIGénération de codeBenchmarksÉvaluations

Résumé généré par Claude — vérifié par l'humain