一种新的基于函数逼近协同更新的DQN算法

**松; 陈建平<sup>*</sup>; 傅启明; 高振; 陆悠; 吴宏杰

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

一种新的基于函数逼近协同更新的DQN算法

作者：**松; 陈建平^*; 傅启明; 高振; 陆悠; 吴宏杰

来源：计算机科学, 2020, S1: 130-147.

摘要

针对经典深度Q网络(Deep Q-Network,DQN)算法在训练初期收敛速度慢的问题,文中提出一种新的基于函数逼近协同更新的DQN算法。该算法在经典的DQN算法的基础上融合了线性函数方法,在训练的初期利用线性函数逼近器来代替神经网络中的行为值函数网络,并提出一种离策略值函数更新规则,与DQN协同更新值函数参数,加快神经网络的参数优化,进而加快算法的收敛速度。将改进后的算法与DQN算法用于CartPole和Mountain Car问题,实验结果表明,改进后的算法具有更快的收敛速度。

单位
苏州科技大学

收藏分享被引(8) 浏览

更新时间：2024-04-13 04:44

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号