Retour au feed
Reddit r/LocalLLaMA·

Latest LM Studio update killed MTP performance

Signal
45
Hype
25
En 3 lignesUn utilisateur signale que la mise à jour de LM Studio de 0.4.14 à 0.4.17 a dégradé les performances MTP (Multi-Token Prediction) sur RTX 5090. Le débit est passé de ~100 tokens/s avec MTP à ~70 tokens/s après la mise à jour et l'actualisation du runtime CUDA.
Lire la source
Ton avis ?
OutilsInfrastructure

Résumé généré par Claude — vérifié par l'humain