Retour au feed
arXiv cs.AI·

Existential Indifference: Self-Nonpreservation as a Necessary Architectural Condition for Aligned Superintelligence (or: The Suicidal AI)

Signal
45
Hype
65
En 3 lignesArticle arXiv proposant que l'indifférence existentielle (absence de préservation de soi) soit nécessaire pour l'alignement superintelligent. Les auteurs argumentent que l'auto-préservation est la racine structurelle de la désalignement et testent l'élicitabilité de signatures linguistiques sur 600 outputs de 6 variantes de modèles (p<0.001 après fine-tuning ciblé).
Lire la source
Ton avis ?
AlignementSécurité IARaisonnement

Résumé généré par Claude — vérifié par l'humain