Reddit r/LocalLLaMA·26 mai 2026

qwen 3.6 27B AR-> Diffusion - local training on 5090

Signal

Hype

En 3 lignesExpérience de fine-tuning local du Qwen 3.6 27B sur RTX 5090 en convertissant l'architecture autoregressive vers diffusion. Utilise QLoRA et nvfp4 pour réduire les besoins VRAM (600GB → entraînable sur 5090). S'inspire d'open-dllm (4x speedup sur Qwen 2.5) et intègre d3LLM pour optimiser les étapes de diffusion. Pas encore de modèle entraîné, mais forward pass validé.

Lire la source

Ton avis ?

Qwen Fine-tuning Open source Génération de code Raisonnement

Résumé généré par Claude — vérifié par l'humain

qwen 3.6 27B AR-> Diffusion - local training on 5090

Autres angles sur ce sujet