基于自适应动量更新策略的Adams算法

李满园; 罗飞<sup>*</sup>; 顾春华; 罗勇军; 丁炜超

doi:10.13255/j.cnki.jusst.20230106004

摘要

Adam算法是目前最常用的优化算法之一，但其面临学习率震荡导致模型不收敛问题，其改进算法AMSGrad也存在梯度递减导致的二阶动量失效问题。针对上述问题，提出了基于自适应动量更新策略的Adams算法。首先，通过为一阶动量和二阶动量引入自适应更新参数，并在最后的参数更新期间采用较小的一阶动量更新参数，构建了一种自适应的动量更新策略。其次，基于该更新策略，提出了一种能够快速收敛的Adams算法。最后，通过理论分析证明了Adams算法的收敛性。基于文本分类和图像分类的对比实验表明，相比于Adam和AMSGrad算法，Adams收敛速度更快、训练结果更好，且具有优秀的泛化能力；消融实验证明了Adams算法自适应动量更新策略的有效性。

单位
华东理工大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-15 18:50

基于自适应动量更新策略的Adams算法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友