Elias in the Lighthouse, Again? Diagnosing Low Diversity in LLM Stories
Signal
72
Hype
25
En 3 lignesÉtude sur 20 000 histoires générées par 4 LLM : 11 mots (Elias, Mara, Elara, lighthouse, clockmaker, librarian) apparaissent dans 88,3% des récits. Ces tokens proviennent de données de préférence utilisées lors de l'alignement, pas des données d'entraînement. Révèle l'impact disproportionné de petits datasets combinés à des algorithmes d'alignement puissants.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain