Retour au feed
arXiv cs.AI·

Towards Responsibly Non-Compliant Machines

Signal
45
Hype
25
En 3 lignesArticle théorique sur la conception d'agents autonomes capables de refuser responsablement les demandes utilisateur. Propose un cadre incluant justifications du refus, mécanismes de révocation et suivi des risques de sécurité.
Lire la source
Ton avis ?
Agents IASécurité IAAlignement

Résumé généré par Claude — vérifié par l'humain