I built a tool that shows you what GPT-2 is "thinking" in real-time as it generates 3D graph of concept activations per token [R]
Signal
72
Hype
35
En 3 lignesAXON visualise en temps réel les activations de concepts dans GPT-2 via un graphe 3D force-directed. Un Sparse Autoencoder décompose le residual stream en features interprétables (géographie, villes, langues) à chaque token généré. Stack : TransformerLens + SAELens (backend), FastAPI WebSocket, Three.js (frontend). ~35ms/token sur GPU.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain