arXiv cs.CL·21 mai 2026

Interpretable Discriminative Text Representations via Agreement and Label Disentanglement

Signal

Hype

En 3 lignesMéthode LFD (LLM-assisted Feature Discovery) pour générer des représentations textuelles interprétables via accord inter-annotateurs (Cohen's κ) et désenchevêtrement des labels. Validation sur 10 tâches de classification texte : features plus claires et moins label-entrelacées qu'une baseline bottleneck, confirmé par audit humain (232 raters).

Lire la source

Ton avis ?

Évaluations Papers

Résumé généré par Claude — vérifié par l'humain

Interpretable Discriminative Text Representations via Agreement and Label Disentanglement

Autres angles sur ce sujet