arXiv cs.AI·19 mai 2026

Minor First, Major Last: A Depth-Induced Implicit Bias of Sharpness-Aware Minimization

Signal

Hype

En 3 lignesÉtude de l'implicit bias de Sharpness-Aware Minimization (SAM) sur réseaux linéaux diagonaux en classification binaire. Pour L=1, ℓ∞-SAM et ℓ2-SAM retrouvent le max-margin classifier ℓ2 comme la descente de gradient. À L=2, ℓ2-SAM exhibe un phénomène de « sequential feature amplification » : le prédicteur s'appuie d'abord sur les coordonnées mineures avant de basculer vers les majeures, contrastant avec GD.

Lire la source

Ton avis ?

Raisonnement Papers

Résumé généré par Claude — vérifié par l'humain

Minor First, Major Last: A Depth-Induced Implicit Bias of Sharpness-Aware Minimization

Autres angles sur ce sujet