From Volume to Value: Preference-Aligned Memory Construction for On-Device RAG
Signal
78
Hype
25
En 3 lignesEPIC (Efficient Preference-aligned Index Construction) optimise la RAG sur appareil en stockant les préférences utilisateur plutôt que des données brutes. Sur 4 benchmarks, réduit la mémoire d'indexation de 2404×, améliore la précision de suivi des préférences de 20,17 points, et abaisse la latence de récupération de 33,33×. Empreinte mémoire < 1 MB avec 29,35 ms/requête.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain