Retour au feed
arXiv cs.AI·

ARROW: Augmented Replay for RObust World models

Signal
72
Hype
18
En 3 lignesARROW étend DreamerV3 avec un système de replay à deux buffers (court et long terme) pour l'apprentissage par renforcement continu. Testé sur Atari et Procgen, l'algorithme réduit l'oubli catastrophique tout en maintenant le transfert de connaissances, inspiré par la relecture d'expériences dans le cerveau.
Lire la source
Ton avis ?
Reinforcement learningPapersBenchmarks

Résumé généré par Claude — vérifié par l'humain