Retour au feed
arXiv cs.CL·

Retrieval-Based Multi-Label Legal Annotation: Extensible, Data-Efficient and Hallucination-Free

Signal
78
Hype
15
En 3 lignesMéthode de retrieval pour l'annotation multi-label juridique : embedding figé de documents et descriptions de labels, prédiction par k-NN. Sur Eurlex (100 labels), Qwen-8B atteint Macro-F1 49.12 vs 40.41 (GPT-5.2 zero-shot), réduit compute de 20-30×. Élimine les hallucinations (GPT-5.2 : 0.12-0.9% labels hors taxonomie).
Lire la source
Ton avis ?
RAGEmbeddingsBenchmarksÉvaluations

Résumé généré par Claude — vérifié par l'humain