Retour au feed
arXiv cs.AI·

Parallel Context Compaction for Long-Horizon LLM Agent Serving

Signal
75
Hype
15
En 3 lignesArticle proposant une technique de compaction parallèle du contexte pour les agents LLM long-horizon. La méthode résout les problèmes de latence et d'imprévisibilité des résumés séquentiels en permettant un contrôle fin du volume de résumé. Évaluée sur HotpotQA et LoCoMo avec modèles 8B-120B (dense et MoE).
Lire la source
Ton avis ?
Agents IARaisonnementBenchmarksInfrastructure

Résumé généré par Claude — vérifié par l'humain