Retour au feed
Hacker News (AI)·

Show HN: Tiny-vLLM – high performance LLM inference engine in C++ and CUDA

Signal
35
Hype
15
En 3 lignesTiny-vLLM est un moteur d'inférence LLM haute performance écrit en C++ et CUDA. Projet open-source présenté sur Hacker News avec peu d'engagement initial (score 5, 0 commentaires).
Lire la source
Ton avis ?
InfrastructureOpen sourceGénération de code

Résumé généré par Claude — vérifié par l'humain