基于混合强化学习的自动驾驶汽车行人避撞方法(英文)

作者:李惠乾; 黄晋*; 曹重; 杨殿阁; 钟志华
来源:Frontiers of Information Technology & Electronic Engineering, 2023, 24(01): 131-141.

摘要

确保行人的安全对自动驾驶汽车而言至关重要,同时也具有一定挑战。经典的行人避撞策略无法应对不确定性,而基于学习的方法缺乏明确的性能保障。本文提出一种基于混合强化学习的行人避撞方法,以使自动驾驶车辆能够与具有行为不确定性的行人安全交互。该方法集成了规则策略和强化学习策略,并设计了一个激活函数选择具有更高置信度的作为最终策略,通过这种方式保证最终策略的表现不亚于规则策略。为说明所提方法的有效性,本文使用一种加速测试方法生成了行为随机的行人进行仿真验证。结果表明,该方法在测试场景中的成功率,相比基准方法的94.4%,提升至98.8%。