Multi-Agent Reinforcement Learning for Safe Autonomous Driving Under Pedestrian Behavioral Uncertainty
Signal
75
Hype
15
En 3 lignesEntraînement conjoint d'une voiture autonome et de 12 piétons via MARL (MAPPO) en simulation. Le SDC atteint 78% de ses objectifs avec 14% de collisions, contre 35%/33% pour la baseline. Les jaywalkers (13% des traversées) causent 62% des collisions. Co-entraînement réduit les collisions de 30% vs RL monoagent.Lire la source
Ton avis ?
Résumé généré par Claude — vérifié par l'humain