MATE: Solving Contextual Markov Decision Processes with Memory of Accumulated Transition Embeddings
Signal
72
Hype
15
En 3 lignesMATE est une architecture mémoire pour résoudre les processus décisionnels de Markov contextuels (CMDP). Elle remplace la distribution a posteriori intractable par une mémoire agrégée par somme, évitant les coûts de calcul croissants des Transformers et les problèmes de gradient des RNN. Les évaluations montrent des avantages computationnels avec performance comparable aux baselines.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain