基于Q学习算法的随机离散时间系统的随机线性二次最优追踪控制

张正义; 赵学艳

doi:10.13878/j.cnki.jnuist.2021.05.006

摘要

针对随机线性离散时间系统,利用Q学习算法求解无限时域的随机线性二次最优追踪控制(SLQT)问题.首先,假设通过命令生成器生成追踪所需的参考信号,并建立一个由原随机系统和参考轨迹系统组成的增广系统,把最优追踪问题转化为最优调节问题的形式.其次,为了在线求解随机系统的最优追踪问题,将随机系统转为确定性系统,并根据增广系统定义随机线性二次最优追踪控制的Q函数,在无需知道系统模型参数的情况下在线求解增广随机代数方程(GSAE).再次,证明了Q学习算法和增广随机代数方程的等价性,给出了Q学习算法实现步骤.最后,给出一个仿真实例说明Q学习算法的有效性.

单位
华南理工大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-10-24 21:23

基于Q学习算法的随机离散时间系统的随机线性二次最优追踪控制

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友