nvidia/Qwen3.6-35B-A3B-NVFP4 · Hugging Face
Signal
75
Hype
15
En 3 lignesNVIDIA a quantifié le modèle Qwen3.6-35B-A3B d'Alibaba en NVFP4 (4 bits) via Model Optimizer. La réduction passe de 16 à 4 bits par paramètre, divisant par 3,06x la mémoire GPU et l'espace disque. Les benchmarks (MMLU Pro, GPQA Diamond, etc.) montrent une dégradation minimale : 85,6→85,0 sur MMLU Pro.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain