Learning Native Continuation for Action Chunking Flow Policies
Signal
72
Hype
18
En 3 lignesLegato est une méthode d'entraînement pour les politiques VLA basées sur des flux d'actions chunked. Elle initialise le débruitage à partir d'un mélange d'actions connues et de bruit, et reshape la dynamique du flux pour assurer la cohérence entre entraînement et inférence. Tests réels : 10% d'amélioration en fluidité de trajectoire et temps de tâche vs RTC.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain