Retour au feed
arXiv cs.CL·

Language models fail at extended rule following

Signal
78
Hype
25
En 3 lignesLes modèles de langage échouent à appliquer des règles simples de manière fiable sur des séquences longues. Test sur 126 variantes : tous les modèles ne peuvent pas compter au-delà d'un seuil dépendant du modèle. Les défaillances sont abruptes et persistent malgré l'augmentation de la taille et du calcul. L'analyse mécanique révèle que les modèles utilisent un nombre fini d'états internes pour simuler le comptage.
Lire la source
Ton avis ?
RaisonnementBenchmarksAgents IAAlignement

Résumé généré par Claude — vérifié par l'humain