Retour au feed
arXiv cs.LG·

Multi-Agent Reinforcement Learning for Safe Autonomous Driving Under Pedestrian Behavioral Uncertainty

Signal
75
Hype
15
En 3 lignesEntraînement conjoint d'une voiture autonome et de 12 piétons via MARL (MAPPO) en simulation. Le SDC atteint 78% de ses objectifs avec 14% de collisions, contre 35%/33% pour la baseline. Les jaywalkers (13% des traversées) causent 62% des collisions. Co-entraînement réduit les collisions de 30% vs RL monoagent.
Lire la source
Ton avis ?
Multi-agentsReinforcement learningSécurité IARobotique

Résumé généré par Claude — vérifié par l'humain