DeepMind Just Dropped "DiffusionGemma" — Text Generation via Image-Style Diffusion Model
Signal
78
Hype
35
En 3 lignesDeepMind publie DiffusionGemma, modèle 26B MoE (3.8B actifs) sous Apache 2.0. Au lieu de générer token par token, il utilise la diffusion pour raffiner 256 tokens simultanément. Atteint 1000+ tokens/s sur H100, 700+ sur RTX 5090. Intégration native vLLM, Unsloth, HF Transformers.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain