Retour au feed
arXiv cs.LG·

Feature Lottery? A Bifurcation Theory of Concept Emergence

Signal
78
Hype
15
En 3 lignesThéorie de bifurcation pour détecter en temps réel l'émergence de représentations structurées dans les réseaux de neurones. Un ratio dynamique β(t)/βc(t) basé sur la Hessienne de la perte prédit quatre régimes de transition distincts (SAE sur Pythia, SSL CIFAR, grokking arithmétique). À 5% de l'entraînement, la pureté précoce des atomes prédit la convergence finale avec 12x le baseline.
Lire la source
Ton avis ?
PapersRaisonnementFine-tuningÉvaluations

Résumé généré par Claude — vérifié par l'humain