Retour au feed
Reddit r/LocalLLaMA·

I can fit 28% more context after building llama.cpp with OpenBLAS. Huh?

Signal
35
Hype
15
En 3 lignesUn utilisateur rapporte que llama.cpp compilé avec Vulkan + OpenBLAS accepte 28% plus de contexte (112,896 tokens vs 87,808) sur Qwen 3.6 27B. Le phénomène reste inexpliqué : comportement attendu, bug ou artefact.
Lire la source
Ton avis ?
LlamaOpen sourceInfrastructure

Résumé généré par Claude — vérifié par l'humain