Reddit r/LocalLLaMA·25 mai 2026

llama.cpp oom issue

Signal

Hype

En 3 lignesUtilisateur signale une fuite mémoire système dans llama.cpp avec Qwen3.6-27B-MTP-GGUF après 20-40 minutes d'utilisation active. Le processus consomme progressivement plus de RAM malgré diverses tentatives de configuration (--no-mmap, --cache-ram 0, sans MTP). Problème persiste sur plusieurs builds et images Docker.

Lire la source

Ton avis ?

Llama Open source Infrastructure

Résumé généré par Claude — vérifié par l'humain

llama.cpp oom issue

Autres angles sur ce sujet