Retour au feed
arXiv cs.LG·

A Training-Time Diagnostic for Generalization via the Log-Alignment Ratio

Signal
78
Hype
15
En 3 lignesÉtude du log-alignment ratio (LAR), métrique de l'alignement paramètre-activation. LAR prédit la transition mémorisation/généralisation en grokking (dimension effective k ≈ n^(2(1-LAR))) et dans le pré-entraînement de modèles 3B. Calculable sans données de validation, overhead négligeable.
Lire la source
Ton avis ?
PapersRaisonnementÉvaluations

Résumé généré par Claude — vérifié par l'humain