Reddit r/LocalLLaMA·30 mai 2026

nvidia/Qwen3.6-35B-A3B-NVFP4 · Hugging Face

Signal

Hype

En 3 lignesNVIDIA a quantifié le modèle Qwen3.6-35B-A3B d'Alibaba en NVFP4 (4 bits) via Model Optimizer. La réduction passe de 16 à 4 bits par paramètre, divisant par 3,06x la mémoire GPU et l'espace disque. Les benchmarks (MMLU Pro, GPQA Diamond, etc.) montrent une dégradation minimale : 85,6→85,0 sur MMLU Pro.

Lire la source

Ton avis ?

Qwen Fine-tuning Benchmarks Infrastructure

Résumé généré par Claude — vérifié par l'humain

nvidia/Qwen3.6-35B-A3B-NVFP4 · Hugging Face

Autres angles sur ce sujet