Reddit r/MachineLearning·20 mai 2026

NOML-NOML: hierarchical TD3 + anchor policy for flight control [P]

Signal

Hype

En 3 lignesAlgorithme RL personnalisé NOML pour le contrôle de vol continu en 6-DoF. Combine TD3 avec politique d'ancrage (action sûre fixe), acteur hiérarchique (3 MLPs indépendants pitch→roll→reste) et apprentissage miroir (symétrie gauche-droite). Résout l'instabilité oscillatoire du TD3 vanilla. Code open-source Apache 2.0.

Lire la source

Ton avis ?

Reinforcement learning Génération de code Robotique Open source

Résumé généré par Claude — vérifié par l'humain

NOML-NOML: hierarchical TD3 + anchor policy for flight control [P]

Autres angles sur ce sujet