摘要
为确保安全关键型系统在安全区域内运行并保持最佳性能,提出一种基于强化学习的安全最优控制跟踪算法。通过在评价函数中加入控制屏障函数,兼顾系统的安全性和最优性;通过在控制屏障函数中加入阻尼系数,指定其对评价函数的相对支配能力。引入强化学习的思想,实现系统动力学未知系统的安全最优跟踪控制,证明了跟踪控制系统能在安全区域内能实现最优性和稳定性。利用二连杆平面机械手仿真验证所提算法的有效性。实验结果表明,机械手末端位置被控制在安全范围内的同时,也实现稳定下的最优性能表现。仿真结果证明了新算法能实现安全最优的跟踪控制效果。
-
单位中国计量大学; 机电工程学院