llama.cpp oom issue
Signal
35
Hype
15
En 3 lignesUtilisateur signale une fuite mémoire système dans llama.cpp avec Qwen3.6-27B-MTP-GGUF après 20-40 minutes d'utilisation active. Le processus consomme progressivement plus de RAM malgré diverses tentatives de configuration (--no-mmap, --cache-ram 0, sans MTP). Problème persiste sur plusieurs builds et images Docker.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain