Retour au feed
Reddit r/LocalLLaMA·

Mimo 2.5 Pro - 40t/s on 8x Nvidia Spark/GB10 cluster

Signal
45
Hype
25
En 3 lignesMimo 2.5 Pro atteint 40 t/s sur cluster 8x Nvidia GB10 avec contexte 1k, dégradant à 17 t/s en contexte 250k. Parallélisation : 60 t/s (2 requêtes), 83 t/s (4 requêtes). Modèle 1T optimisé via mtp-2.
Lire la source
Ton avis ?
Open sourceInfrastructureBenchmarks

Résumé généré par Claude — vérifié par l'humain