Retour au feed
Reddit r/LocalLLaMA·

Why might DiffusionGemma be better at tool calls than its benchmark quality suggests

Signal
35
Hype
45
En 3 lignesDiffusionGemma génère 256 tokens en parallèle avec attention bidirectionnelle, permettant l'auto-correction avant finalisation. Contrairement aux modèles autorégressifs figés après chaque token, cette architecture pourrait améliorer les appels d'outils structurés malgré une qualité de base inférieure à Gemma 4. Reste à tester si la correction bidirectionnelle compense la qualité plus faible.
Lire la source
Ton avis ?
GeminiGénération de codeRaisonnement

Résumé généré par Claude — vérifié par l'humain