arXiv cs.AI·19 mai 2026

Lance: Unified Multimodal Modeling by Multi-Task Synergy

Signal

Hype

En 3 lignesLance est un modèle multimodal unifié léger supportant compréhension, génération et édition d'images et vidéos. Basé sur une architecture dual-stream mixture-of-experts avec encodage positionnel rotatif modulé par modalité, il combine apprentissage multi-tâche collaboratif et planification adaptative des données pour surpasser les modèles open-source existants en génération visuelle.

Lire la source

Ton avis ?

Vision Génération de vidéos Génération d'images Multi-agents Papers

Résumé généré par Claude — vérifié par l'humain

Lance: Unified Multimodal Modeling by Multi-Task Synergy

Autres angles sur ce sujet