arXiv cs.AI·19 mai 2026

Geometry-aware 4D Video Generation for Robot Manipulation

Signal

Hype

En 3 lignesModèle de génération vidéo 4D pour la manipulation robotique qui enforce la cohérence multi-vue 3D via supervision par alignement de pointmap cross-view. Génère des séquences vidéo spatio-temporellement alignées à partir d'une seule image RGB-D par vue, sans poser en entrée. Démontre stabilité visuelle supérieure et récupération de trajectoires d'effecteur robot sur datasets simulés et réels.

Lire la source

Ton avis ?

Robotique Génération de vidéos Vision Papers

Résumé généré par Claude — vérifié par l'humain

Geometry-aware 4D Video Generation for Robot Manipulation

Autres angles sur ce sujet