分布式Q学习多目标函数优化策略

宋天恒; 李大字; 高彦臣

doi:10.13543/j.cnki.bhxbzr.2011.05.010

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

分布式Q学习多目标函数优化策略

作者：宋天恒; 李大字; 高彦臣

来源：北京化工大学学报(自然科学版), 2011, (05): 125-129.

DOI：10.13543/j.cnki.bhxbzr.2011.05.010

摘要

将分布式Q学习算法与Pareto排序法相结合,提出了一种利用强化学习算法解决多目标优化问题的策略。该策略充分利用Q学习语句式的奖赏机制来描述问题的多重目标函数,并结合一般的Pareto排序法,在有限的迭代过程后输出可以充分接近于Pareto前沿的非支配解集。与其他智能搜索算法相比,该策略具有结构简单、无需先验知识、参数设置少的特点。测试函数优化问题验证了算法的有效性,为智能算法解决多目标优化问题提供了一种新思路。

单位
软控股份有限公司; 北京化工大学

全文

访问全文

收藏分享被引浏览

更新时间：2019-10-02 19:33

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号