arXiv cs.AI·19 mai 2026

When Actions Disappear: Adversarial Action Removal in Self-Play Reinforcement Learning

Signal

Hype

En 3 lignesÉtude d'attaques adversariales par suppression d'actions en apprentissage par renforcement auto-jeu. Un attaquant retire sélectivement des actions légales de l'ensemble disponible pour la victime. Sur des jeux de poker (6 à 5 531 états) et deux domaines non-poker, le masquage appris cause plus de dégâts que le masquage aléatoire. L'attaque persiste sur Q-learning, PPO, NFSP, DQN et ne montre pas de récupération.

Lire la source

Ton avis ?

Reinforcement learning Sécurité IA Benchmarks

Résumé généré par Claude — vérifié par l'humain

When Actions Disappear: Adversarial Action Removal in Self-Play Reinforcement Learning

Autres angles sur ce sujet