Retrieval-Based Multi-Label Legal Annotation: Extensible, Data-Efficient and Hallucination-Free
Signal
78
Hype
15
En 3 lignesMéthode de retrieval pour l'annotation multi-label juridique : embedding figé de documents et descriptions de labels, prédiction par k-NN. Sur Eurlex (100 labels), Qwen-8B atteint Macro-F1 49.12 vs 40.41 (GPT-5.2 zero-shot), réduit compute de 20-30×. Élimine les hallucinations (GPT-5.2 : 0.12-0.9% labels hors taxonomie).Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain