Retour au feed
arXiv cs.AI·

Lance: Unified Multimodal Modeling by Multi-Task Synergy

Signal
72
Hype
28
En 3 lignesLance est un modèle multimodal unifié léger supportant compréhension, génération et édition d'images et vidéos. Basé sur une architecture dual-stream mixture-of-experts avec encodage positionnel rotatif modulé par modalité, il combine apprentissage multi-tâche collaboratif et planification adaptative des données pour surpasser les modèles open-source existants en génération visuelle.
Lire la source
Ton avis ?
VisionGénération de vidéosGénération d'imagesMulti-agentsPapers

Résumé généré par Claude — vérifié par l'humain