Retour au feed
Reddit r/LocalLLaMA·

Granite 4.1 Architecture Changes?

Signal
35
Hype
15
En 3 lignesUn utilisateur de r/LocalLLaMA questionne le choix d'IBM de revenir à une architecture transformer pure pour Granite 4.1, abandonnant l'architecture hybride mamba-attention de Granite 4. Sur du matériel modeste (8GB VRAM), Granite 4 offrait 128k contexte à ~1000 tok/s en ingestion, tandis que Granite 4.1 plafonne à 14k contexte et ~300 tok/s. L'utilisateur demande si IBM continuera à proposer l'architecture mamba.
Lire la source
Ton avis ?
Open sourceRaisonnement

Résumé généré par Claude — vérifié par l'humain