Le signal de l'IA, pas le bruit.

Testing robustness against unforeseen adversaries

OpenAI présente une méthode d'évaluation de la robustesse des classifieurs de réseaux de neurones face à des attaques adversariales non vues en entraînement. La métrique UAR (Unforeseen Attack Robustness) mesure la capacité d'un modèle unique à résister à des attaques inattendues et souligne l'importance d'évaluer la performance sur une gamme d'attaques diversifiées.

OpenAI Sécurité IA Évaluations

SIG

HYP

août 2019

Testing robustness against unforeseen adversaries

GPT-2: 6-month follow-up