基于强化学习的改进三维A*算法在线航迹规划

任智; 张栋<sup>*</sup>; 唐硕

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于强化学习的改进三维A*算法在线航迹规划

作者：任智; 张栋^*; 唐硕

来源：系统工程与电子技术, 2023, 45(01): 193-201.

摘要

针对飞行器在线航迹规划对算法实时性与结果最优性要求高的问题，基于强化学习方法改进三维A*算法。首先，引入收缩因子改进代价函数的启发信息加权方法提升算法时间性能；其次，建立算法实时性与结果最优性的性能变化度量模型，结合深度确定性策略梯度方法设计动作-状态与奖励函数，对收缩因子进行优化训练；最后，在多场景下对改进后的三维A*算法进行仿真验证。仿真结果表明，改进算法能够在保证航迹结果最优性的同时有效提升算法时间性能。

单位
航天学院; 西北工业大学

收藏分享被引(3) 浏览

更新时间：2024-03-19 06:25

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号