NVFP4 + MTP - voilà on llama.cpp
Signal
65
Hype
15
En 3 lignesNVFP4 et MTP sont maintenant disponibles simultanément dans llama.cpp (release b9297). Cette combinaison de quantification et d'optimisation permet une meilleure performance sur GPU NVIDIA.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain