Retour au feed
arXiv cs.AI·

GraphARC: A Comprehensive Benchmark for Graph-Based Abstract Reasoning

Signal
78
Hype
15
En 3 lignesGraphARC est un benchmark d'IA pour le raisonnement abstrait sur graphes, généralisant le paradigme ARC à des données structurées en graphes. Les modèles de langage actuels échouent sur les transformations complètes de graphes malgré une compréhension des propriétés, révélant un fossé entre compréhension et exécution.
Lire la source
Ton avis ?
BenchmarksRaisonnementPapers

Résumé généré par Claude — vérifié par l'humain