Retour au feed
Reddit r/LocalLLaMA·

Deepseek V4 flash performance on DGX Spark

Signal
65
Hype
15
En 3 lignesUtilisateur déploie Deepseek V4 Flash sur DGX Spark (2x ASUS GX10) via vLLM. Contexte max 256k tokens, débit prefill 1680-2150 T/s, décode 37-49 T/s selon fenêtre. Performance stable, dégradation faible. Modèle surpasse M2.7 et Stepfun 3.7 en raisonnement haute contexte.
Lire la source
Ton avis ?
DeepSeekInfrastructureBenchmarksRaisonnement

Résumé généré par Claude — vérifié par l'humain