Retour au feed
Reddit r/LocalLLaMA·

Xiaomi just claimed 1,000+ tps on a 1T model using a standard 8-GPU server

Signal
35
Hype
72
En 3 lignesXiaomi annonce MiMo-V2.5-Pro UltraSpeed avec 1 000+ tokens/sec sur un modèle MoE de 1T paramètres sur serveur 8-GPU standard, sans hardware spécialisé.
Lire la source
Ton avis ?
Open sourceBenchmarksInfrastructure

Résumé généré par Claude — vérifié par l'humain