针对强化学习(RL)中存在的鲁棒性问题,综述了鲁棒强化学习(RRL)的研究进展和在航天控制中的应用与展望。首先阐释了鲁棒强化学习的基本内涵;然后从引入H∞控制理论的鲁棒强化学习、域随机化方法、鲁棒对抗强化学习3个类别分析总结了鲁棒强化学习研究的主要方法;最后分析了鲁棒强化学习在航天控制中的应用,并面向未来复杂化、智能化的航天工程任务,提出了值得研究的问题和发展方向。