Reddit r/LocalLLaMA·11 juin 2026

NVFP4 with llama.cpp - FAQs?

Signal

Hype

En 3 lignesDiscussion communautaire sur NVFP4 dans llama.cpp. Utilisateurs comparent NVFP4 avec quantifications Q4-Q8 pour GPUs 8GB (RTX 4060, AMD, Intel). Questions : qualité NVFP4 vs Q6/Q8, benchmarks (vitesse, perplexité), modèles recommandés (Qwen 3.5-9B, Gemma-4-12B). Ressources : listes HuggingFace NVFP4 et GGUFs.

Lire la source

Ton avis ?

Llama Open source Benchmarks

Résumé généré par Claude — vérifié par l'humain

NVFP4 with llama.cpp - FAQs?

Autres angles sur ce sujet