Retour au feed
Reddit r/LocalLLaMA·

GitHub - chopratejas/headroom: Compress tool outputs, logs, files, and RAG chunks before they reach the LLM. 60-95% fewer tokens, same answers. Library, proxy, MCP server.

Signal
65
Hype
25
En 3 lignesHeadroom compresse les sorties d'outils, logs, fichiers et chunks RAG avant envoi au LLM, réduisant de 60-95% les tokens consommés sans dégrader la qualité. Disponible en tant que librairie, proxy ou serveur MCP.
Lire la source
Ton avis ?
RAGMCPOutilsOpen source

Résumé généré par Claude — vérifié par l'humain