一种面向多核计算环境的BP神经网络并行化方法

作者:汤德佑; 梁珩琳; 曾庆淼; 张亚卓; 汤达祺; 邹春刚
来源:2017-02-10, 中国, CN201710073067.1.

摘要

本发明提供了一种面向多核计算环境的BP神经网络并行化方法。包括:并行计算任务划分及映射方法;存储各层中间计算结果的缓存设置方法;BP神经网络的并行训练方法。所述对含P个计算单元的硬件平台,任务划分方法对将隐藏层和输出层计算任务整体组合成一个粒度更大任务,提高并行性;所述缓存设置方法,在一趟训练过程中,同一变量被上一个子任务访问后可用于下一个子任务,下一个子任务不会产生Cache缺失;所述BP神经网络训练方法中,样本分成K批进入网络训练,K值的设计综合计算平台的二级缓存大小,与缓存设置相结合,最大限度发挥硬件性能,适用于多核计算平台下的BP神经网络应用。