Retour au feed
Reddit r/LocalLLaMA·

llama.cpp oom issue

Signal
35
Hype
15
En 3 lignesUtilisateur signale une fuite mémoire système dans llama.cpp avec Qwen3.6-27B-MTP-GGUF après 20-40 minutes d'utilisation active. Le processus consomme progressivement plus de RAM malgré diverses tentatives de configuration (--no-mmap, --cache-ram 0, sans MTP). Problème persiste sur plusieurs builds et images Docker.
Lire la source
Ton avis ?
LlamaOpen sourceInfrastructure

Résumé généré par Claude — vérifié par l'humain