Retour au feed
Reddit r/LocalLLaMA·

$16 refactor, 400 steps, 95% routed to open MoE

Signal
72
Hype
28
En 3 lignesDéveloppeur réduit les coûts Claude Opus de $160 à $16 en routant 95% des étapes vers Hunyuan Hy3 (MoE 21B) via une couche de routage vLLM. Sur 400 étapes de refactoring Python, Hy3 traite 380 étapes à $0.02 chacune ($7.60), Opus les 20 restantes ($8). Taux de succès 93.4%, mais échoue sur graphes de dépendances complexes.
Lire la source
Ton avis ?
Agents IAMCPGénération de codeOpen sourceInfrastructure

Résumé généré par Claude — vérifié par l'humain