Language models fail at extended rule following
Signal
78
Hype
25
En 3 lignesLes modèles de langage échouent à appliquer des règles simples de manière fiable sur des séquences longues. Test sur 126 variantes : tous les modèles ne peuvent pas compter au-delà d'un seuil dépendant du modèle. Les défaillances sont abruptes et persistent malgré l'augmentation de la taille et du calcul. L'analyse mécanique révèle que les modèles utilisent un nombre fini d'états internes pour simuler le comptage.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain