Retour au feed
arXiv cs.AI·

AgroCoT: A Chain-of-Thought Benchmark for Evaluating Reasoning in Vision-Language Models for Agriculture

Signal
75
Hype
25
En 3 lignesAgroCoT est un benchmark VQA de 4 759 échantillons avec raisonnement Chain-of-Thought pour évaluer les capacités de raisonnement des Vision-Language Models en agriculture. L'évaluation de 30 VLMs (propriétaires et open-source) révèle des lacunes significatives en zéro-shot, soulignant l'importance du CoT pour les applications de précision agricole.
Lire la source
Ton avis ?
VisionBenchmarksRaisonnementÉvaluations

Résumé généré par Claude — vérifié par l'humain