Retour au feed
arXiv cs.CL·

From Volume to Value: Preference-Aligned Memory Construction for On-Device RAG

Signal
78
Hype
25
En 3 lignesEPIC est une méthode de construction d'index RAG optimisée pour les agents IA sur appareil. Elle réduit la mémoire d'indexation de 2 404× en se concentrant sur les préférences utilisateur, améliore la précision de suivi des préférences de 20,17 points et diminue la latence de récupération de 33,33×. Empreinte mémoire < 1 MB avec 29,35 ms/requête.
Lire la source
Ton avis ?
RAGAgents IAEmbeddings

Résumé généré par Claude — vérifié par l'humain