AGORA: Adapter-Grounded Observation-Action Retention for Inference-Free Prompt Compression in LLM Agents
Signal
72
Hype
15
En 3 lignesAGORA propose une méthode de compression de prompts sans inférence pour agents LLM, basée sur des adaptateurs et la rétention d'observations-actions. Les compresseurs extractifs token-level standards échouent sur les agents (75% de performance en 8/9 cas). L'ablation révèle que la structure et le scorer adaptatif permettent 1.0-11.5x de compression.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain