Reddit r/LocalLLaMA·19 mai 2026

Floor for local meeting summarization on a 6GB GPU: qwen3.5:0.8b works at 57s, Granite 4 350M hallucinates

Signal

Hype

En 3 lignesBenchmark de petits modèles locaux pour résumé de réunions sur GPU 6GB. Qwen3.5:0.8b génère un résumé structuré en 57s avec 2.2GB VRAM. Granite 4 350M est plus rapide (0.6-2.8s) mais hallucine (invente des sujets, confond les entités).

Lire la source

Ton avis ?

Qwen Génération de code Benchmarks Open source Outils

Résumé généré par Claude — vérifié par l'humain

Floor for local meeting summarization on a 6GB GPU: qwen3.5:0.8b works at 57s, Granite 4 350M hallucinates

Autres angles sur ce sujet