Retour au feed
Reddit r/MachineLearning·

Backprop-free Pong: PC + distributional Hebbian plasticity vs. PPO: 57% vs. 59%, ~1500 lines from scratch [P]

Signal
72
Hype
25
En 3 lignesComparaison d'un agent bio-plausible sans rétropropagation (Predictive Coding + plasticité Hebbian distribuée) vs PPO sur Pong : 57% vs 59%. L'écart de 2% provient de l'oubli catastrophique en self-play, non de l'absence de backprop. Code ~1500 lignes disponible.
Lire la source
Ton avis ?
Reinforcement learningRaisonnementPapersOpen source

Résumé généré par Claude — vérifié par l'humain