摘要
针对带有不确定干扰的级联非线性系统的跟踪控制问题,将控制和干扰视为博弈的双方,在跟踪过程中将跟踪轨迹的最优性考虑在内,利用反推技术设计前馈控制器,将严格反馈系统的跟踪控制问题转化成等价的仿射系统的零和微分博弈问题;采用自适应动态规划(adaptive dynamic programming,ADP)技术,构建评价网络、控制网络和干扰网络实时在线学习,近似求解非线性零和微分博弈产生的HJI (hamilton-jacobi-isaacs)方程,进而得到值函数、控制策略和干扰策略。利用Lyapunov理论,证明了基于反推技术的零和微分博弈的收敛性和闭环系统的稳定性。仿真实例验证了该方法的有效性。
-
单位北京信息科技大学; 自动化学院