Retour au feed
arXiv cs.CL·

From Documents to Segments: A Contextual Reformulation for Topic Assignment

Signal
72
Hype
18
En 3 lignesNouvelle approche de topic modeling (SBTA) qui assigne des topics à des segments de texte plutôt qu'à des documents entiers, réduisant la contamination thématique. Les auteurs créent SemEval-STM, un dataset annoté via LLM + révision humaine, et valident l'amélioration de la qualité et interprétabilité sur plusieurs modèles.
Lire la source
Ton avis ?
PapersBenchmarksRAG

Résumé généré par Claude — vérifié par l'humain