基于Q学习的管制员Agent学习行为研究

作者:刘岳鹏; 隋东; 林颖达
来源:哈尔滨商业大学学报(自然科学版), 2016, 32(06): 763-768.
DOI:10.19492/j.cnki.1672-0946.2016.06.026

摘要

管制员Agent是空中交通运行仿真系统中的核心部分,为了提高其知识库的完备程度,做到空中交通的精确仿真,可以考虑将机器学习理论引入管制员Agent模型.研究了相关机器学习算法,提出管制员Agent的个体机器学习行为,选择Q学习算法对管制员Agent的学习行为进行建模,使管制员Agent能在空中交通运行仿真中取得最优策略,完善自身冲突解脱知识库的不足.仿真结果证明了管制员Agent学习行为的合理性.

全文