Retour au feed
Reddit r/LocalLLaMA·

Llama.cpp VS LiteRT on a custom Xiaomi 12 Pro 24/7 Server (V2 Redesign)

Signal
65
Hype
25
En 3 lignesComparaison llama.cpp vs LiteRT (Google) sur serveur 24/7 custom basé Xiaomi 12 Pro (Snapdragon 8 Gen 1). Llama.cpp : 30.6 t/s prompt, 5.7 t/s génération, charge CPU modérée. LiteRT : génération légèrement plus rapide mais saturation CPU et consommation électrique supérieure. Setup inclut refroidissement cuivre/aluminium, alimentation custom sécurisée, boîtier 3D-imprimé.
Lire la source
Ton avis ?
LlamaOpen sourceBenchmarksInfrastructure

Résumé généré par Claude — vérifié par l'humain