Hugging Face Blog·19 janvier 2021

Fit More and Train Faster With ZeRO via DeepSpeed and FairScale

Signal

Hype

En 3 lignesHugging Face intègre ZeRO (Zero Redundancy Optimizer) de DeepSpeed et FairScale pour réduire la mémoire GPU et accélérer l'entraînement des modèles. ZeRO partitionne états d'optimiseur, gradients et paramètres entre GPUs, permettant d'entraîner des modèles plus grands avec moins de ressources.

Lire la source

Ton avis ?

Infrastructure Fine-tuning Open source

Résumé généré par Claude — vérifié par l'humain

Fit More and Train Faster With ZeRO via DeepSpeed and FairScale

Autres angles sur ce sujet