Retour au feed
Reddit r/LocalLLaMA·

Floor for local meeting summarization on a 6GB GPU: qwen3.5:0.8b works at 57s, Granite 4 350M hallucinates

Signal
72
Hype
15
En 3 lignesBenchmark de petits modèles locaux pour résumé de réunions sur GPU 6GB. Qwen3.5:0.8b génère un résumé structuré en 57s avec 2.2GB VRAM. Granite 4 350M est plus rapide (0.6-2.8s) mais hallucine (invente des sujets, confond les entités).
Lire la source
Ton avis ?
QwenGénération de codeBenchmarksOpen sourceOutils

Résumé généré par Claude — vérifié par l'humain