结合先验知识的深度Q神经网络算法研究

褚伟; 茹琦; 任明仑

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

结合先验知识的深度Q神经网络算法研究

作者：褚伟; 茹琦; 任明仑

来源：合肥工业大学学报(自然科学版), 2019, 42(07): 901-958.

摘要

深度Q神经网络(deep Q-network,DQN)算法在训练初期,由于动作选择随机性强,导致算法的训练时间过长。针对该问题,文章提出一种结合先验知识的深度Q神经网络(priori knowledge-DQN,PK-DQN)算法,将先验知识定义为特征状态与最优动作的映射,根据先验知识对动作选择过程的影响程度,将先验知识引入DQN算法,优化DQN算法的动作选择规则,降低其在探索过程中的动作选择随机性,并使用赛车游戏对算法进行训练。实验结果表明,PK-DQN算法能够更快收敛,有较高的学习效率,算法训练时长明显缩短。

单位
合肥工业大学

收藏分享被引浏览

更新时间：2024-04-10 03:32

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号