Inferencing at 10.33 t/s on Qwen 3.5 35B on a $300 laptop
Signal
72
Hype
25
En 3 lignesInférence CPU à 10,33 tokens/s sur Qwen 3.5 35B quantifié Q4_K_M sur un laptop Lenovo Ideapad Slim 3i ($300, i3-1215U, 8GB RAM). Utilise llama.cpp avec optimisations BIOS, pinning de cores, speculative decoding MTP et quantization K/V cache Q8_0.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain