Retour au feed
arXiv cs.CL·

SenseJudge: Human-Centric Preference-Driven Judgment Framework

Signal
72
Hype
28
En 3 lignesSenseJudge est un framework de jugement personnalisé basé sur les préférences humaines pour évaluer les réponses d'LLM. Associé à SenseBench, un benchmark d'instruction-following issu d'interactions multi-tours réelles, il surpasse les méthodes existantes en adaptation aux préférences utilisateur et en classement de modèles aligné avec le jugement humain.
Lire la source
Ton avis ?
ÉvaluationsBenchmarksRaisonnement

Résumé généré par Claude — vérifié par l'humain