Retour au feed
arXiv cs.CL·

RealityTest: How People Probe AI Identity and Whether Models Disclose It

Signal
78
Hype
25
En 3 lignesRealityTest évalue si les systèmes IA divulguent leur identité quand interrogés. Benchmark multilingue et multimodal basé sur 3 152 requêtes collectées auprès de ~750 participants dans 49 pays, 5 langues (texte et voix). Résultats : 31% seulement posent la question directement ; une instruction de suppression réduit la divulgation sous 30% même pour les meilleurs modèles.
Lire la source
Ton avis ?
Sécurité IAÉvaluationsBenchmarksRégulation

Résumé généré par Claude — vérifié par l'humain