Retour au feed
arXiv cs.CL·

Investigating Cross-Modal Skill Injection: Scenarios, Methods, and Hyperparameters

Signal
72
Hype
18
En 3 lignesÉtude sur l'injection de compétences cross-modales : transfert d'expertise d'un LLM spécialisé vers un VLM via fusion de modèles. Analyse systématique de 3 aspects : scénarios (succès en suivi d'instructions et cross-lingue, échec en raisonnement mathématique), méthodes (TA et DARE surpassent les alternatives), hyperparamètres. Évite SFT coûteux.
Lire la source
Ton avis ?
Fine-tuningVisionRaisonnementPapers

Résumé généré par Claude — vérifié par l'humain