Latent Cache Flow: Model-to-Model Communication Without Text
Signal
72
Hype
25
En 3 lignesLatent Cache Flow (LCF) permet la communication directe entre modèles de langage via des représentations latentes comprimées au lieu du texte. L'approche réduit la taille de l'adaptateur à 4% de celle de Cache-to-Cache (C2C) et gère les contextes différents en transmettant un résumé des informations nouvelles. LCF atteint 23% de précision supérieure et 8.5x plus rapide que la communication textuelle.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain