Retour au feed
arXiv cs.AI·

Geometry-aware 4D Video Generation for Robot Manipulation

Signal
72
Hype
18
En 3 lignesModèle de génération vidéo 4D pour la manipulation robotique qui enforce la cohérence multi-vue 3D via supervision par alignement de pointmap cross-view. Génère des séquences vidéo spatio-temporellement alignées à partir d'une seule image RGB-D par vue, sans poser en entrée. Démontre stabilité visuelle supérieure et récupération de trajectoires d'effecteur robot sur datasets simulés et réels.
Lire la source
Ton avis ?
RobotiqueGénération de vidéosVisionPapers

Résumé généré par Claude — vérifié par l'humain