Data Scaling as Progressive Coverage of a Predictive Contribution Spectrum
Signal
78
Hype
15
En 3 lignesÉtude arXiv montrant que les lois de scaling des données réelles sont gouvernées par la couverture progressive d'un spectre latent de contributions prédictives, au-delà des seules queues de fréquence. Via une représentation d'automate de suffixes, les auteurs définissent un spectre global-KL et démontrent une corrélation forte (R²≈0.96) entre la pente du spectre et l'exposant empirique de scaling sur 12 corpus.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain