Retour au feed
arXiv cs.AI·

One Policy, Infinite NPCs: Persona-Traceable Shared RL Policies for Scalable Game Agents

Signal
78
Hype
25
En 3 lignesPCSP, une politique RL unique conditionnée par embeddings LLM gelés, contrôle 300 NPCs avec identités distinctes. Atteint 17x la chance en identification zero-shot, ρ=0.73 d'alignement sémantique-comportemental, 22x plus rapide qu'un baseline LLM. Déployé en UE5 sur 64 agents avec faible taux d'erreur.
Lire la source
Ton avis ?
Reinforcement learningAgents IAMulti-agentsBenchmarks

Résumé généré par Claude — vérifié par l'humain