Retour au feed
arXiv cs.AI·

From Volume to Value: Preference-Aligned Memory Construction for On-Device RAG

Signal
78
Hype
25
En 3 lignesEPIC (Efficient Preference-aligned Index Construction) optimise la RAG sur appareil en stockant les préférences utilisateur plutôt que des données brutes. Sur 4 benchmarks, réduit la mémoire d'indexation de 2404×, améliore la précision de suivi des préférences de 20,17 points, et abaisse la latence de récupération de 33,33×. Empreinte mémoire < 1 MB avec 29,35 ms/requête.
Lire la source
Ton avis ?
RAGAgents IAEmbeddingsPapers

Résumé généré par Claude — vérifié par l'humain