Floor for local meeting summarization on a 6GB GPU: qwen3.5:0.8b works at 57s, Granite 4 350M hallucinates
Signal
72
Hype
15
En 3 lignesBenchmark de petits modèles locaux pour résumé de réunions sur GPU 6GB. Qwen3.5:0.8b génère un résumé structuré en 57s avec 2.2GB VRAM. Granite 4 350M est plus rapide (0.6-2.8s) mais hallucine (invente des sujets, confond les entités).Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain