Retour au feed
Reddit r/LocalLLaMA·

DeepSeek V4 Flash is amazing! (WIP llama.cpp PR #24162)

Signal
65
Hype
45
En 3 lignesDeepSeek V4 Flash obtient le support llama.cpp via PR #24162 en phase précoce. Le modèle combine intelligence frontière, robustesse à la quantization (FP4-FP8 natif) et efficacité KV cache. Actuellement 5-6 tokens/s, GPU/FA en développement, mais correctness validée.
Lire la source
Ton avis ?
DeepSeekOpen sourceInfrastructure

Résumé généré par Claude — vérifié par l'humain