Interpretable Discriminative Text Representations via Agreement and Label Disentanglement
Signal
72
Hype
18
En 3 lignesMéthode LFD (LLM-assisted Feature Discovery) pour générer des représentations textuelles interprétables via accord inter-annotateurs (Cohen's κ) et désenchevêtrement des labels. Validation sur 10 tâches de classification texte : features plus claires et moins label-entrelacées qu'une baseline bottleneck, confirmé par audit humain (232 raters).Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain