Retour au feed
arXiv cs.CL·

T-FIX: Text-Based Explanations with Features Interpretable to eXperts

Signal
72
Hype
18
En 3 lignesT-FIX est un cadre d'évaluation pour mesurer l'alignement des explications générées par les LLM avec le raisonnement d'experts dans des domaines spécialisés (chirurgie, astronomie, thérapie). Couvre sept tâches scientifiques sur trois domaines avec critères définis par des experts. Permet une évaluation automatique et généralisable sans annotation continue d'experts.
Lire la source
Ton avis ?
ÉvaluationsRaisonnementSécurité IA

Résumé généré par Claude — vérifié par l'humain