Retour au feed
Reddit r/MachineLearning·

NOML-NOML: hierarchical TD3 + anchor policy for flight control [P]

Signal
72
Hype
25
En 3 lignesAlgorithme RL personnalisé NOML pour le contrôle de vol continu en 6-DoF. Combine TD3 avec politique d'ancrage (action sûre fixe), acteur hiérarchique (3 MLPs indépendants pitch→roll→reste) et apprentissage miroir (symétrie gauche-droite). Résout l'instabilité oscillatoire du TD3 vanilla. Code open-source Apache 2.0.
Lire la source
Ton avis ?
Reinforcement learningGénération de codeRobotiqueOpen source

Résumé généré par Claude — vérifié par l'humain