Retour au feed
Reddit r/LocalLLaMA·

StepFun 3.7 Flash - Speed Benchmark in M5 Max

Signal
65
Hype
15
En 3 lignesBenchmark de StepFun 3.7 Flash sur M5 Max (128 GB) avec llama.cpp. Contextes courts (<16k tokens) rapides et réactifs. Contextes 32k-64k utilisables. Mesures détaillées : 65k tokens atteint 360.79 t/s en token generation.
Lire la source
Ton avis ?
Open sourceBenchmarksInfrastructure

Résumé généré par Claude — vérifié par l'humain