Model Merging by Output-Space Projection
Signal
78
Hype
15
En 3 lignesNouvelle méthode de fusion de modèles formulée comme programme quadratique convexe sur les mises à jour résiduelles. Subsume les approches existantes (task arithmetic, model soups, TIES, DARE) et fournit un diagnostic fermé prédisant la qualité de fusion via la fraction d'énergie résiduelle capturée. Gains constants sur benchmarks langage et vision.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain