Retour au feed
arXiv cs.LG·

Orth-Dion: Eliminating Geometric Mismatch in Distributed Low-Rank Spectral Optimization

Signal
72
Hype
15
En 3 lignesOrth-Dion améliore Dion, un optimiseur spectral pour l'entraînement distribué à faible rang. En remplaçant la normalisation de colonnes par une orthogonalisation QR, la méthode élimine un facteur √r dans la convergence et atteint le taux O(√L_r/T) des méthodes spectrales exactes. Validation sur pré-entraînement de modèles de langage.
Lire la source
Ton avis ?
Reinforcement learningBenchmarksPapers

Résumé généré par Claude — vérifié par l'humain