RealityTest: How People Probe AI Identity and Whether Models Disclose It
Signal
78
Hype
25
En 3 lignesRealityTest évalue si les systèmes IA divulguent leur identité quand interrogés. Benchmark multilingue et multimodal basé sur 3 152 requêtes collectées auprès de ~750 participants dans 49 pays, 5 langues (texte et voix). Résultats : 31% seulement posent la question directement ; une instruction de suppression réduit la divulgation sous 30% même pour les meilleurs modèles.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain