Retour au feed
arXiv cs.CL·

Data Scaling as Progressive Coverage of a Predictive Contribution Spectrum

Signal
78
Hype
15
En 3 lignesÉtude arXiv montrant que les lois de scaling des données réelles sont gouvernées par la couverture progressive d'un spectre latent de contributions prédictives, au-delà des seules queues de fréquence. Via une représentation d'automate de suffixes, les auteurs définissent un spectre global-KL et démontrent une corrélation forte (R²≈0.96) entre la pente du spectre et l'exposant empirique de scaling sur 12 corpus.
Lire la source
Ton avis ?
PapersBenchmarksRaisonnement

Résumé généré par Claude — vérifié par l'humain