Reddit r/LocalLLaMA·2 juin 2026

Qwen 3.6-35B-A3B with 977 tk/s prompt processing and 262k context window on Intel Arc B70 Pro

Signal

Hype

En 3 lignesQwen 3.6-35B-A3B atteint 977 tokens/s en traitement de prompt et supporte une fenêtre de contexte de 262k sur Intel Arc B70 Pro via llama.cpp avec backend SYCL. L'utilisateur rapporte une inférence locale stable et utilisable pour des tâches complexes comme la génération de jeux.

Lire la source

Ton avis ?

Qwen Génération de code Open source Infrastructure

Résumé généré par Claude — vérifié par l'humain

Qwen 3.6-35B-A3B with 977 tk/s prompt processing and 262k context window on Intel Arc B70 Pro

Autres angles sur ce sujet