Retour au feed
arXiv cs.AI·

Personalizing Embodied Multimodal Large Language Model Agents over Long-term User Interactions

Signal
72
Hype
28
En 3 lignesPOLAR est un framework pour agents embodiés basés sur MLLM qui personnalise l'assistance via un graphe de connaissances multimodal. Il organise les interactions passées en mémoire sémantique (concepts visuels) et épisodique (trajectoires), améliorant les performances notamment pour le raisonnement multi-hop et le suivi du contexte utilisateur.
Lire la source
Ton avis ?
Agents IAVisionRAGRaisonnementPapers

Résumé généré par Claude — vérifié par l'humain