Language models fail at extended rule following
Les modèles de langage échouent à appliquer des règles simples de manière fiable sur des séquences longues. Test sur 126 variantes : tous les modèles ne peuvent pas compter au-delà d'un seuil dépendant du modèle. Les défaillances sont abruptes et persistent malgré l'augmentation de la taille et du calcul. L'analyse mécanique révèle que les modèles utilisent un nombre fini d'états internes pour simuler le comptage.