Retour au feed
arXiv cs.CL·

Disentangling Ambiguity from Instability in Large Language Models: A Clinical Text-to-SQL Case Study

Signal
75
Hype
15
En 3 lignesCLUES, un framework pour Text-to-SQL clinique, décompose l'incertitude sémantique en scores d'ambiguïté et d'instabilité via le complément de Schur d'une matrice de graphe bipartite. Testé sur AmbigQA/SituatedQA et un benchmark clinique, il surpasse Kernel Language Entropy et permet un triage efficace : 51% des erreurs dans 25% des requêtes.
Lire la source
Ton avis ?
PapersBenchmarksÉvaluationsSécurité IA

Résumé généré par Claude — vérifié par l'humain