Retour au feed
Reddit r/LocalLLaMA·

nvidia/Qwen3.6-35B-A3B-NVFP4 · Hugging Face

Signal
75
Hype
15
En 3 lignesNVIDIA a quantifié le modèle Qwen3.6-35B-A3B d'Alibaba en NVFP4 (4 bits) via Model Optimizer. La réduction passe de 16 à 4 bits par paramètre, divisant par 3,06x la mémoire GPU et l'espace disque. Les benchmarks (MMLU Pro, GPQA Diamond, etc.) montrent une dégradation minimale : 85,6→85,0 sur MMLU Pro.
Lire la source
Ton avis ?
QwenFine-tuningBenchmarksInfrastructure

Résumé généré par Claude — vérifié par l'humain