arXiv cs.CL·2 juin 2026

SALSA: Speech Aware LLM Adaptation via Learned Steering Activation Vectors

Signal

Hype

En 3 lignesSALSA adapte les modèles de langage multimodaux à la parole via des vecteurs de direction appris par couche. La méthode optimise directement ces vecteurs sur enfants, multilingue et code-switching mandarin-anglais, gagnant jusqu'à 46,8% vs zéro-shot. Diriger l'encodeur (couches tardives) surpasse diriger le décodeur LLM.

Lire la source

Ton avis ?

Voix Fine-tuning Raisonnement

Résumé généré par Claude — vérifié par l'humain

SALSA: Speech Aware LLM Adaptation via Learned Steering Activation Vectors

Autres angles sur ce sujet