arXiv cs.CL·27 mai 2026

Elias in the Lighthouse, Again? Diagnosing Low Diversity in LLM Stories

Signal

Hype

En 3 lignesÉtude sur 20 000 histoires générées par 4 LLM : 11 mots (Elias, Mara, Elara, lighthouse, clockmaker, librarian) apparaissent dans 88,3% des récits. Ces tokens proviennent de données de préférence utilisées lors de l'alignement, pas des données d'entraînement. Révèle l'impact disproportionné de petits datasets combinés à des algorithmes d'alignement puissants.

Lire la source

Ton avis ?

Benchmarks Alignement Évaluations

Résumé généré par Claude — vérifié par l'humain

Elias in the Lighthouse, Again? Diagnosing Low Diversity in LLM Stories

Autres angles sur ce sujet