结合DDPG与优先数据剪枝的样本处理方法

向卉; 刘建明

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

结合DDPG与优先数据剪枝的样本处理方法

作者：向卉; 刘建明

来源：计算机仿真, 2021, 38(06): 428-433.

摘要

针对深度确定性策略梯度算法(DDPG)中的经验回放机制,提出了一种综合了高优先级数据重播和高相似度数据剪枝,并对送入网络训练的样本数据进行处理的方法。针对先进先出存储方法和重放缓冲区中随机采样方式造成经验回放效率较低的问题,提出了解决方案:选择高优先级样本送入网络进行训练,同时移除缓冲区中的相似度较高的样本并保留一些罕见的样本。通过相关实验表明,方法不仅可以在更短的训练时间内达到更好的性能,而且可以加快训练过程,提高学习稳定性和长期记忆能力。

单位
桂林电子科技大学

收藏分享被引浏览

更新时间：2024-04-17 10:59

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号