Retour au feed
Hacker News (AI)·

768GB Intel Optane DIMMs to run 1T-parameter LLM with single GPU at 4tps

Signal
35
Hype
45
En 3 lignesIntel Optane DIMMs 768 Go permettent d'exécuter un LLM de 1 trillion de paramètres sur un seul GPU à 4 tokens/s. Configuration matérielle pour inférence de modèles très larges sans infrastructure distribuée.
Lire la source
Ton avis ?
InfrastructureBenchmarks

Résumé généré par Claude — vérifié par l'humain