SocialMemBench: Are AI Memory Systems Ready for Social Group Settings?
Signal
78
Hype
15
En 3 lignesSocialMemBench évalue les systèmes de mémoire IA dans les groupes sociaux multi-parties. Le benchmark inclut 430 personas, 7,355 tours de conversation et 1,031 paires QA sur 5 archetypes sociaux. Gemini 2.5 Flash atteint 0.721 sur petits réseaux; les frameworks open-source (Mem0, LangMem, Graphiti, Cognee) plafonnent à 0.12-0.18, révélant un écart significatif.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain