Reddit r/LocalLLaMA·23 mai 2026

Llama.cpp VS LiteRT on a custom Xiaomi 12 Pro 24/7 Server (V2 Redesign)

Signal

Hype

En 3 lignesComparaison llama.cpp vs LiteRT (Google) sur serveur 24/7 custom basé Xiaomi 12 Pro (Snapdragon 8 Gen 1). Llama.cpp : 30.6 t/s prompt, 5.7 t/s génération, charge CPU modérée. LiteRT : génération légèrement plus rapide mais saturation CPU et consommation électrique supérieure. Setup inclut refroidissement cuivre/aluminium, alimentation custom sécurisée, boîtier 3D-imprimé.

Lire la source

Ton avis ?

Llama Open source Benchmarks Infrastructure

Résumé généré par Claude — vérifié par l'humain

Llama.cpp VS LiteRT on a custom Xiaomi 12 Pro 24/7 Server (V2 Redesign)

Autres angles sur ce sujet