Retour au feed
Reddit r/LocalLLaMA·

Benchmarked inference engines for M1 Max 64gb-results & analysis

Signal
65
Hype
25
En 3 lignesBenchmark d'engines d'inférence sur M1 Max 64GB comparant rapid-mlx, omlx, mlx-lm et ollama avec Qwen 3.5-4B. Rapid-mlx obtient les meilleures performances en vitesse et efficacité mémoire. Résultats publiés sur le leaderboard mlx-chronos.
Lire la source
Ton avis ?
QwenBenchmarksOpen sourceInfrastructure

Résumé généré par Claude — vérifié par l'humain