Show HN: Tiny-vLLM – high performance LLM inference engine in C++ and CUDA
Signal
35
Hype
15
En 3 lignesTiny-vLLM est un moteur d'inférence LLM haute performance écrit en C++ et CUDA. Projet open-source présenté sur Hacker News avec peu d'engagement initial (score 5, 0 commentaires).Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain