Why might DiffusionGemma be better at tool calls than its benchmark quality suggests
Signal
35
Hype
45
En 3 lignesDiffusionGemma génère 256 tokens en parallèle avec attention bidirectionnelle, permettant l'auto-correction avant finalisation. Contrairement aux modèles autorégressifs figés après chaque token, cette architecture pourrait améliorer les appels d'outils structurés malgré une qualité de base inférieure à Gemma 4. Reste à tester si la correction bidirectionnelle compense la qualité plus faible.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain