Retour au feed
arXiv cs.LG·

Inner Product Aware Quantization: Provably Fast, Accurate, and Adaptive Algorithms

Signal
72
Hype
15
En 3 lignesNouvelle méthode de quantization préservant les produits scalaires avec vecteurs non vus. Algorithmes adaptatifs et non-biaisés développés avec garanties théoriques. Implémentations pratiques 2-10× plus rapides que l'état de l'art en Adaptive Stochastic Quantization.
Lire la source
Ton avis ?
BenchmarksFine-tuning

Résumé généré par Claude — vérifié par l'humain