面向冲突解脱的强化学习模型奖励函数研究

王壮; 周少武; 陈祉达; 李晨翔

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

面向冲突解脱的强化学习模型奖励函数研究

作者：王壮; 周少武; 陈祉达; 李晨翔

来源：中国民航飞行学院学报, 2023, 34(06): 10-15.

摘要

空中交通流量的急剧增加使得空域运行复杂度持续加大，迫切需要空管的智能化改进。冲突探测与解脱是空管的核心组成部分，前期研究初步证实了使用强化学习方法进行冲突解脱智能决策生成的可行性。针对关键的奖励函数设计环节，本文首先介绍了使用强化学习进行冲突解脱的运行框架，然后对国内外研究中使用的奖励函数进行归纳和分析，最后给出了冲突解脱强化学习方法的奖励函数设计准则与建议。希望通过本文给研究者以启发，优化智能冲突解脱关键环节，促进智慧空管落地应用。

单位
中国民用航空飞行学院

收藏分享被引浏览

更新时间：2024-03-18 16:00

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号