📚 3LM: A Benchmark for Arabic LLMs in STEM and Code
Signal
75
Hype
20
En 3 lignesHugging Face publie 3LM, un benchmark évaluant les LLMs arabes sur les tâches STEM et code. Le dataset couvre mathématiques, physique, chimie et programmation en arabe, permettant de mesurer les capacités des modèles dans ces domaines spécialisés.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain