基于改进分层强化学习的CPS指令多目标动态优化分配算法

余涛; 王宇名; 叶文加; 刘前进

doi:10.13334/j.0258-8013.pcsee.2011.19.013

摘要

应用经典强化学习方法的控制性能标准(control performance standard,CPS)下自动发电控制(automatic generation control,AGC)指令(CPS指令)由调度端至电网各台机组的分配过程不可避免出现维数灾难问题。提出应用分层强化学习的方法,将全网机组按调频时延做初次分类,CPS指令逐层分配形成任务分层结构。在分层Q学习算法层与层之间引入一个时变协调因子,改进的分层Q学习算法有效提高原算法收敛速度。奖励函数中设计不同的权值线性组合,展示保守及乐观控制下系统CPS控制水平和调节成本的变化关系。南方电网统计性仿真分析表明,改进分层Q学习算法较分层Q学习...

单位
广东电网公司中山供电局; 华南理工大学

全文

访问全文

收藏分享被引浏览

更新时间：2019-09-17 05:51

基于改进分层强化学习的CPS指令多目标动态优化分配算法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友