Retour au feed
Reddit r/LocalLLaMA·

Newer Qwen models are worse at summarization?

Signal
35
Hype
25
En 3 lignesUn utilisateur rapporte que Qwen 3 (30B) surpasse les modèles récents sur des tâches de résumé évalués par un juge LLM, suivi de Gemma 4. Il suggère que les versions plus récentes de Qwen seraient optimisées pour les tâches agentic plutôt que la synthèse.
Lire la source
Ton avis ?
QwenBenchmarksÉvaluations

Résumé généré par Claude — vérifié par l'humain