ProtStructQA: A Denotation Threshold in Protein Structural Reasoning
Signal
78
Hype
15
En 3 lignesProtStructQA est un benchmark exécutable pour la réponse à des questions sur les structures protéiques. 382.2K questions générées depuis un langage spécialisé caché, évaluées sur Qwen3 (0.6B–8B) et Gemma-3. Découverte clé : seuil de capacité entre Qwen3-1.7B et 4B où les modèles passent de l'incapacité à produire des dénotations exécutables à la maîtrise du raisonnement chaîné.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain