Retour au feed
arXiv cs.AI·

$ECUAS_n$: A family of metrics for principled evaluation of uncertainty-augmented systems

Signal
72
Hype
18
En 3 lignesNouvelle famille de métriques ECUAS_n pour évaluer les systèmes d'IA qui produisent prédictions + scores d'incertitude. Formalisées comme proper scoring rules, elles permettent d'ajuster le compromis entre erreurs de prédiction et imprécisions d'incertitude selon le cas d'usage. Validées sur classification, génération et TriviaQA.
Lire la source
Ton avis ?
ÉvaluationsBenchmarksSécurité IA

Résumé généré par Claude — vérifié par l'humain