鲁棒强化学习及其在航天控制中的应用与展望

作者:张立宪; 卢生奥; 韩铭昊; 姜芊鹏; 李云鹏; 徐恺鑫
来源:航天控制, 2021, 39(03): 3-11.
DOI:10.16804/j.cnki.issn1006-3242.2021.03.001

摘要

针对强化学习(RL)中存在的鲁棒性问题,综述了鲁棒强化学习(RRL)的研究进展和在航天控制中的应用与展望。首先阐释了鲁棒强化学习的基本内涵;然后从引入H∞控制理论的鲁棒强化学习、域随机化方法、鲁棒对抗强化学习3个类别分析总结了鲁棒强化学习研究的主要方法;最后分析了鲁棒强化学习在航天控制中的应用,并面向未来复杂化、智能化的航天工程任务,提出了值得研究的问题和发展方向。

全文