Retour au feed
OpenAI Blog·

OpenAI Baselines: ACKTR & A2C

Signal
75
Hype
15
En 3 lignesOpenAI publie deux implémentations Baselines : A2C (variante synchrone déterministe d'A3C) et ACKTR (algorithme RL plus efficace en échantillons que TRPO/A2C, coût computationnel similaire à A2C).
Lire la source
Ton avis ?
Reinforcement learningOpen sourceOpenAI

Résumé généré par Claude — vérifié par l'humain