Deep double descent
Signal
75
Hype
25
En 3 lignesOpenAI démontre que la double descente (performance s'améliore, puis se dégrade, puis s'améliore à nouveau) survient dans les CNNs, ResNets et transformers avec l'augmentation de la taille du modèle, des données ou du temps d'entraînement. Le phénomène est universel mais mal compris.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain