Reddit r/LocalLLaMA·6 juin 2026

Experimentation with Qwen 3.6 and Gemma 4 - Guidance needed

Signal

Hype

En 3 lignesDéveloppeur testant Qwen 3.6 et Gemma 4 en local sur matériel modeste (i5-12400, 64GB RAM, 2x GTX 1050 Ti). Obtient ~40 t/s en traitement de prompt et 12-18 t/s en génération. MoE, quantization et speculative decoding rendent les LLMs locaux viables sans hardware coûteux.

Lire la source

Ton avis ?

Qwen Gemini Open source Outils Infrastructure

Résumé généré par Claude — vérifié par l'humain

Experimentation with Qwen 3.6 and Gemma 4 - Guidance needed

Autres angles sur ce sujet