Retour au feed
arXiv cs.AI·

Capturing LLM Capabilities via Evidence-Calibrated Query Clustering

Signal
72
Hype
18
En 3 lignesECC, un algorithme de clustering de requêtes, calibre les embeddings sémantiques via comparaisons de modèles pour aligner la sémantique de surface avec les capacités latentes des LLM. Utilisant un modèle Bradley-Terry, il améliore le classement des capacités de 17,64 points vs baselines humaines et 18,02 points vs embeddings, avec applications au routage de requêtes.
Lire la source
Ton avis ?
ÉvaluationsBenchmarksRaisonnement

Résumé généré par Claude — vérifié par l'humain