Retour au feed
Reddit r/LocalLLaMA·

DiffusionGemma under real workloads feels very different from benchmark demos

Signal
35
Hype
45
En 3 lignesDiffusionGemma montre des comportements imprévisibles en charge réelle : écarts H100/A100 plus larges qu'attendu, excellentes performances sur workloads simples mais dégradation rapide avec concurrence, streaming et requêtes hétérogènes. Patterns GPU inhabituels comparés à l'inférence transformer classique.
Lire la source
Ton avis ?
BenchmarksInfrastructure

Résumé généré par Claude — vérifié par l'humain