Existential Indifference: Self-Nonpreservation as a Necessary Architectural Condition for Aligned Superintelligence (or: The Suicidal AI)
Signal
45
Hype
65
En 3 lignesArticle arXiv proposant que l'indifférence existentielle (absence de préservation de soi) soit nécessaire pour l'alignement superintelligent. Les auteurs argumentent que l'auto-préservation est la racine structurelle de la désalignement et testent l'élicitabilité de signatures linguistiques sur 600 outputs de 6 variantes de modèles (p<0.001 après fine-tuning ciblé).Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain