From Documents to Segments: A Contextual Reformulation for Topic Assignment
Signal
72
Hype
18
En 3 lignesNouvelle approche de topic modeling (SBTA) qui assigne des topics à des segments de texte plutôt qu'à des documents entiers, réduisant la contamination thématique. Les auteurs créent SemEval-STM, un dataset annoté via LLM + révision humaine, et valident l'amélioration de la qualité et interprétabilité sur plusieurs modèles.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain