Retour au feed
arXiv cs.LG·

Spectral Asymptotics of Neural Network Loss Landscapes: An Exact Decomposition of the Curvature Exponent

Signal
78
Hype
15
En 3 lignesÉtude théorique de la géométrie des paysages de perte des réseaux de neurones. Les auteurs prouvent une décomposition spectrale expliquant pourquoi l'exposant de courbure α varie selon les couches (α≈2 convolutions, α≈1 attention transformer, α<1 MLP). Validation empirique sur 93 couches, 5 architectures, 3 datasets avec erreur médiane ~2%.
Lire la source
Ton avis ?
PapersRaisonnementBenchmarks

Résumé généré par Claude — vérifié par l'humain