Better exploration with parameter noise
OpenAI démontre que l'ajout de bruit adaptatif aux paramètres des algorithmes d'apprentissage par renforcement améliore régulièrement les performances. Cette méthode d'exploration est simple à implémenter et rarement dégradante.