Retour au feed
arXiv cs.AI·

Auditable Decision Models with Learned Abstention and Real-Time Steering

Signal
72
Hype
18
En 3 lignesEvaluatorDPT est un modèle de contrôle décisionnel borné qui prédit YES, NO ou TBD (déférence apprise). Utilisant un encodeur transformer avec têtes auxiliaires structurées, il atteint Accuracy=0.8260 et Macro F1=0.8252 sur 44,597 exemples. L'interface permet un routage inspectable et un contrôle auditable des décisions en production.
Lire la source
Ton avis ?
RaisonnementÉvaluationsSécurité IAAlignement

Résumé généré par Claude — vérifié par l'humain