Retour au feed
arXiv cs.LG·

Spectral-Progressive Thought Flow for Lightweight Multimodal Reasoning

Signal
72
Hype
18
En 3 lignesSpecFlow propose un cadre léger de raisonnement spatial multimodal utilisant l'espace cosinus discret pour représenter les pensées visuelles intermédiaires. Via guidance sans classificateur, les pensées textuelles autogénératives dirigent les mises à jour visuelles sans expansion de contexte. Résultat : réduction jusqu'à 2,1× des coûts de calcul et cache KV avec performance compétitive.
Lire la source
Ton avis ?
RaisonnementVisionMulti-agentsPapers

Résumé généré par Claude — vérifié par l'humain