Testing robustness against unforeseen adversaries
OpenAI présente une méthode d'évaluation de la robustesse des classifieurs de réseaux de neurones face à des attaques adversariales non vues en entraînement. La métrique UAR (Unforeseen Attack Robustness) mesure la capacité d'un modèle unique à résister à des attaques inattendues et souligne l'importance d'évaluer la performance sur une gamme d'attaques diversifiées.