摘要

在传统的非局部操作中,对各个位置点之间长距离依赖性的逐个计算导致了庞大的计算量,使得其并不能成为一种即插即用的有效模块。基于此问题,我们提出一种新型的轻量级非局部(Lightweight Factorized Non-local,LFN)模块。LFN模块利用捕捉全局依赖性的非局部操作来提升神经网络的性能并应用于计算机视觉领域。LFN模块是对传统非局部操作的因子分解,通过对水平和垂直两个方向进行分解,网络不仅可以捕捉到像素点之间的长距离依赖关系,而且分解后的非局部操作计算量大幅度下降。然后,通过结合LFN模块和残差模块,我们设计RLFN(Residual Lightweight Factorized Non-local)单元,并基于该单元设计两种改良网络结构分别应用于图像分类和语义分割。最后,本文算法在CIFAR-10和PASCAL VOC2012两个数据集上进行分类及语义分割任务,实验结果表现该算法取得十分优越的性能。