Disentangling Ambiguity from Instability in Large Language Models: A Clinical Text-to-SQL Case Study
Signal
75
Hype
15
En 3 lignesCLUES, un framework pour Text-to-SQL clinique, décompose l'incertitude sémantique en scores d'ambiguïté et d'instabilité via le complément de Schur d'une matrice de graphe bipartite. Testé sur AmbigQA/SituatedQA et un benchmark clinique, il surpasse Kernel Language Entropy et permet un triage efficace : 51% des erreurs dans 25% des requêtes.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain