Retour au feed
arXiv cs.LG·

$E^3$-Agent: An Executable and Evolving Agent for Resource Management of Edge Generative Inference

Signal
72
Hype
28
En 3 lignesE³-Agent est un agent IA exécutable et adaptatif pour la gestion des ressources d'inférence générative sur edge. Il combine un routeur rapide (décisions en millisecondes) et un contrôleur LLM lent piloté par événements, apprenant en ligne des retours d'exécution. Évalué en simulation, il réduit la latence de 65-73% vs baselines statiques sur scénarios dynamiques (sémantique, churn, drift).
Lire la source
Ton avis ?
Agents IARaisonnementInfrastructureBenchmarks

Résumé généré par Claude — vérifié par l'humain