Granite 4.1 Architecture Changes?
Signal
35
Hype
15
En 3 lignesUn utilisateur de r/LocalLLaMA questionne le choix d'IBM de revenir à une architecture transformer pure pour Granite 4.1, abandonnant l'architecture hybride mamba-attention de Granite 4. Sur du matériel modeste (8GB VRAM), Granite 4 offrait 128k contexte à ~1000 tok/s en ingestion, tandis que Granite 4.1 plafonne à 14k contexte et ~300 tok/s. L'utilisateur demande si IBM continuera à proposer l'architecture mamba.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain