Geometry-aware 4D Video Generation for Robot Manipulation
Signal
72
Hype
18
En 3 lignesModèle de génération vidéo 4D pour la manipulation robotique qui enforce la cohérence multi-vue 3D via supervision par alignement de pointmap cross-view. Génère des séquences vidéo spatio-temporellement alignées à partir d'une seule image RGB-D par vue, sans poser en entrée. Démontre stabilité visuelle supérieure et récupération de trajectoires d'effecteur robot sur datasets simulés et réels.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain