Retour au feed
Reddit r/MachineLearning·

Sub-JEPA: a simple fix to LeCun group's LeWorldModel that consistently improves performance [P]

Signal
78
Hype
15
En 3 lignesSub-JEPA améliore LeWorldModel (groupe LeCun, NYU) en appliquant la régularisation gaussienne dans des sous-espaces orthogonaux gelés plutôt que globalement. Gains de +10.7 pp sur Two-Room, trajectoires latentes plus droites, décodabilité d'état physique améliorée. Code et papier disponibles.
Lire la source
Ton avis ?
RaisonnementPapersBenchmarks

Résumé généré par Claude — vérifié par l'humain