April 2021

3 articles

Scaling-up BERT Inference on CPU (Part 1)

Hugging Face publishes a guide on optimizing BERT inference on CPU. First part of a series exploring scaling techniques to improve performance without GPU.

Benchmarks Infrastructure Code generation

SIG

HYP

Hugging Face Blog·Apr 16

Introducing 🤗 Accelerate

Hugging Face releases Accelerate, a library for training and inference on multiple GPUs/TPUs without code changes. PyTorch-compatible, it simplifies distributed computing and resource optimization.

Open source Infrastructure Tools

SIG

HYP

Hugging Face Blog·Apr 8

Distributed Training: Train BART/T5 for Summarization using 🤗 Transformers and Amazon SageMaker

Hugging Face releases a guide for distributed training of BART and T5 on Amazon SageMaker. Uses HF Transformers with multi-GPU/multi-node optimizations for summarization tasks. Includes code, benchmarks, and best practices.

Fine-tuning Infrastructure Tools

SIG

HYP