深度学习中的预条件动量梯度算法

作者:张亮亮; 喻高航*
来源:杭州电子科技大学学报(自然科学版), 2021, 41(05): 81-87.
DOI:10.13954/j.cnki.hdu.2021.05.013

摘要

结合"比例-积分-微分"优化控制器(Proportional-Integral-Derivative Controller, PID)与拟牛顿方法,提出一种加速神经网络训练的一类预条件动量梯度算法。首先,采用拟牛顿条件产生预条件因子,然后,在迭代过程中与动量方法相结合,提高算法效率的同时,克服原始动量梯度算法的超调问题,并证明了算法在目标函数强凸时的全局收敛性。最后,通过数值实验验证了算法的有效性。

全文