Retour au feed
Reddit r/LocalLLaMA·

Cost Analysis of my $6.4k Local LLM Server

Signal
72
Hype
15
En 3 lignesAnalyse TCO d'un serveur LLM local de 6400$ équipé de 4x MI100 32GB et CPU EPYC 48-core. Exécute 4 instances llama.cpp avec Qwen 3.6 27B sur ROCm. Traite 20.4M tokens input et 1.32M tokens output/jour. Coût API équivalent: 3701$/an (308$/mois). L'auteur souligne l'importance de l'amortissement matériel pour un TCO réaliste.
Lire la source
Ton avis ?
Open sourceInfrastructureLlamaQwenGénération de code

Résumé généré par Claude — vérifié par l'humain