基于混合强化学习的自动驾驶汽车行人避撞方法（英文）

李惠乾; 黄晋<sup>*</sup>; 曹重; 杨殿阁; 钟志华

摘要

确保行人的安全对自动驾驶汽车而言至关重要，同时也具有一定挑战。经典的行人避撞策略无法应对不确定性，而基于学习的方法缺乏明确的性能保障。本文提出一种基于混合强化学习的行人避撞方法，以使自动驾驶车辆能够与具有行为不确定性的行人安全交互。该方法集成了规则策略和强化学习策略，并设计了一个激活函数选择具有更高置信度的作为最终策略，通过这种方式保证最终策略的表现不亚于规则策略。为说明所提方法的有效性，本文使用一种加速测试方法生成了行为随机的行人进行仿真验证。结果表明，该方法在测试场景中的成功率，相比基准方法的94.4%，提升至98.8%。

单位
清华大学; 中国工程院

收藏分享被引(2) 浏览

更新时间：2024-03-19 03:38

基于混合强化学习的自动驾驶汽车行人避撞方法（英文）

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友