Retour au feed
Reddit r/LocalLLaMA·

DeepMind Just Dropped "DiffusionGemma" — Text Generation via Image-Style Diffusion Model

Signal
78
Hype
35
En 3 lignesDeepMind publie DiffusionGemma, modèle 26B MoE (3.8B actifs) sous Apache 2.0. Au lieu de générer token par token, il utilise la diffusion pour raffiner 256 tokens simultanément. Atteint 1000+ tokens/s sur H100, 700+ sur RTX 5090. Intégration native vLLM, Unsloth, HF Transformers.
Lire la source
Ton avis ?
DeepMindGénération de codeOpen sourceInfrastructure

Résumé généré par Claude — vérifié par l'humain