随着科学技术的发展,电力系统、交通系统、机器人操纵装置系统等实际系统变得越来越复杂,导致难以建立实际系统的精确模型。因此,基于模型的传统优化理论无法适应被控对象的复杂性。在缺乏精确的过程模型的情况下,利用系统数据来提高系统性能、学习最优决策变得尤其重要。近年来,基于数据的学习优化理论和技术得到了广泛的研究与应用,研究者们相继提出了自适应动态规划、强化学习、迭代学习等理论方法。