模型自由的离散时间系统的随机线性二次最优控制

免费注册

科研之友

微信

新浪微博

Facebook

作者：么彩莲; 王涛

来源：辽宁石油化工大学学报, 2016, 36(06): 64-68.

摘要

针对模型自由的随机线性离散时间系统,通过Q学习算法求解无限时间随机线性二次最优控制问题。首先根据贝尔曼最优性原理定义Q函数,通过值迭代算法的思想构造Q学习算法;其次给出Q学习算法的等价形式并证明其收敛性;最后通过一个仿真实例说明Q学习算法的有效性。

更新时间：2024-05-13 14:04

科研之友科研之友机构版科创云

科研成果科研人员科研机构

帮助中心隐私政策服务条款

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号