Retour au feed
Reddit r/LocalLLaMA·

Qwen 3.6-35B-A3B with 977 tk/s prompt processing and 262k context window on Intel Arc B70 Pro

Signal
72
Hype
25
En 3 lignesQwen 3.6-35B-A3B atteint 977 tokens/s en traitement de prompt et supporte une fenêtre de contexte de 262k sur Intel Arc B70 Pro via llama.cpp avec backend SYCL. L'utilisateur rapporte une inférence locale stable et utilisable pour des tâches complexes comme la génération de jeux.
Lire la source
Ton avis ?
QwenGénération de codeOpen sourceInfrastructure

Résumé généré par Claude — vérifié par l'humain