arXiv cs.AI·25 mai 2026

One Policy, Infinite NPCs: Persona-Traceable Shared RL Policies for Scalable Game Agents

Signal

Hype

En 3 lignesPCSP, une politique RL unique conditionnée par embeddings LLM gelés, contrôle 300 NPCs avec identités distinctes. Atteint 17x la chance en identification zero-shot, ρ=0.73 d'alignement sémantique-comportemental, 22x plus rapide qu'un baseline LLM. Déployé en UE5 sur 64 agents avec faible taux d'erreur.

Lire la source

Ton avis ?

Reinforcement learning Agents IA Multi-agents Benchmarks

Résumé généré par Claude — vérifié par l'humain

One Policy, Infinite NPCs: Persona-Traceable Shared RL Policies for Scalable Game Agents

Autres angles sur ce sujet