Open LLM Leaderboard: DROP deep dive
Hugging Face analyse en détail le benchmark DROP du Open LLM Leaderboard, qui évalue la compréhension de lecture et l'extraction d'informations. L'article examine les performances des modèles sur cette tâche spécifique et les défis qu'elle pose.