arXiv cs.LG·21 mai 2026

Multi-Agent Reinforcement Learning for Safe Autonomous Driving Under Pedestrian Behavioral Uncertainty

Signal

Hype

En 3 lignesEntraînement conjoint d'une voiture autonome et de 12 piétons via MARL (MAPPO) en simulation. Le SDC atteint 78% de ses objectifs avec 14% de collisions, contre 35%/33% pour la baseline. Les jaywalkers (13% des traversées) causent 62% des collisions. Co-entraînement réduit les collisions de 30% vs RL monoagent.

Lire la source

Ton avis ?

Multi-agents Reinforcement learning Sécurité IA Robotique

Résumé généré par Claude — vérifié par l'humain

Multi-Agent Reinforcement Learning for Safe Autonomous Driving Under Pedestrian Behavioral Uncertainty

Autres angles sur ce sujet