ADMEDTAGGER: an annotation framework for distillation of expert knowledge for the Polish medical language
Signal
72
Hype
18
En 3 lignesFramework d'annotation utilisant Llama3.1 comme modèle professeur pour étiqueter des textes médicaux polonais. Corpus de 5 catégories cliniques (Radiologie, Oncologie, Cardiologie, Hypertension, Pathologie). DistilBERT atteint F1 > 0.80 par catégorie, 500× plus petit qu'un LLM, 300× moins de VRAM, inférence plusieurs centaines de fois plus rapide.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain