Retour au feed
Hugging Face Blog·

Quanto: a PyTorch quantization backend for Optimum

Signal
75
Hype
25
En 3 lignesHugging Face lance Quanto, un backend de quantification PyTorch intégré à Optimum. Cet outil permet de réduire la taille des modèles et d'accélérer l'inférence via la quantification, compatible avec les modèles transformers populaires.
Lire la source
Ton avis ?
OutilsInfrastructureOpen source

Résumé généré par Claude — vérifié par l'humain