arXiv cs.AI·29 mai 2026

The Cognitive Categorical Transformer: Category-Theoretic Inductive Biases for Language Modeling

Signal

Hype

En 3 lignesLe Cognitive Categorical Transformer (CCT), modèle de 306M paramètres basé sur GPT-2 Small, intègre des composants inspirés de la théorie des catégories et des sciences cognitives. Sur WikiText-103, CCT atteint 21.27 PPL contre 24.19 pour GPT-2 Small, soit une réduction de 12% (2.92 PPL). Les ablations montrent que le simplicial message passing représente 84% de cette amélioration.

Lire la source

Ton avis ?

GPT Papers Benchmarks Raisonnement

Résumé généré par Claude — vérifié par l'humain

The Cognitive Categorical Transformer: Category-Theoretic Inductive Biases for Language Modeling

Autres angles sur ce sujet