基于Q学习的互联电网动态最优CPS控制

余涛; 周斌; 陈家荣

doi:10.13334/j.0258-8013.pcsee.2009.19.015

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于Q学习的互联电网动态最优CPS控制

作者：余涛; 周斌; 陈家荣

来源：中国电机工程学报, 2009, (19): 13-19.

DOI：10.13334/j.0258-8013.pcsee.2009.19.015

摘要

控制性能标准(control performance standard,CPS)下互联电网自动发电控制(automatic generation control,AGC)系统是一个典型的不确定随机系统,应用基于马尔可夫决策过程(Markov decision process,MDP)理论的Q学习算法可有效地实现控制策略的在线学习和动态优化决策。将CPS值作为包含AGC的电力系统"环境"所给的"奖励",依靠Q值函数与CPS控制动作形成的闭环反馈结构进行交互式学习,学习目标为使CPS动作从环境中获得的长期积累奖励值最大。提出一种实用的半监督群体预学习方法,解决了Q学习控制器在预学习试错阶段的系统镇...

单位
香港理工大学; 华南理工大学

全文

访问全文

收藏分享被引浏览

更新时间：2019-05-20 14:25

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号