Reddit r/LocalLLaMA·10 juin 2026

DeepMind Just Dropped "DiffusionGemma" — Text Generation via Image-Style Diffusion Model

Signal

Hype

En 3 lignesDeepMind publie DiffusionGemma, modèle 26B MoE (3.8B actifs) sous Apache 2.0. Au lieu de générer token par token, il utilise la diffusion pour raffiner 256 tokens simultanément. Atteint 1000+ tokens/s sur H100, 700+ sur RTX 5090. Intégration native vLLM, Unsloth, HF Transformers.

Lire la source

Ton avis ?

DeepMind Génération de code Open source Infrastructure

Résumé généré par Claude — vérifié par l'humain

DeepMind Just Dropped "DiffusionGemma" — Text Generation via Image-Style Diffusion Model

Autres angles sur ce sujet