OpenAI Baselines: ACKTR & A2C
Signal
75
Hype
15
En 3 lignesOpenAI publie deux implémentations Baselines : A2C (variante synchrone déterministe d'A3C) et ACKTR (algorithme RL plus efficace en échantillons que TRPO/A2C, coût computationnel similaire à A2C).Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain