EmergentBridge: Improving Zero-Shot Cross-Modal Transfer in Unified Multimodal Embedding Models
Signal
72
Hype
18
En 3 lignesEmergentBridge améliore les modèles d'embedding multimodaux unifiés pour les paires de modalités non appariées (audio↔profondeur, infrarouge↔audio). La méthode apprend un mappage produisant un « noisy bridge anchor » et applique l'alignement dans un sous-espace orthogonal, préservant la structure d'alignement existante. Résultats sur 9 datasets : surpasse les baselines en classification et retrieval zero-shot.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain