Retour au feed
Reddit r/MachineLearning·

Got told my open-source model experiments are too scattered. I'm organizing a journal to provide clarity before structuring the first git release. Is this readable for ML folks who aren’t in mech interp? Open to ANY feedback [D]

Signal
45
Hype
25
En 3 lignesExpérience de mécanique d'interprétation sur Qwen3.5-35B-A3B : un expert routé (E114, couche 14) se corrèle avec un registre d'auto-examen en première personne lors de la génération. L'auteur documente les résultats avant release git, avec décomposition W/S/Q du routage MoE.
Lire la source
Ton avis ?
QwenOpen source

Résumé généré par Claude — vérifié par l'humain