摘要
针对现有注意力机制常采用融合或压缩的方式来获取所需信息,会导致空间或通道维度损失的信息过多的问题,提出了一种有效的轻量级注意力模块SPAM,它可以在不经过通道融合或压缩的情况下获取注意力。对于输入的中间特征图,SPAM首先会自适应地采用平均池化和最大池化来进行特征提取;采用空间上局部的块特征代替点特征以减少计算量,并利用实例标准化(IN)层与深层卷积来捕获全局空间注意力;通道维度信息的重建通过分组卷积来完成;最终使用插值操作获得整体注意力,对输入特征图进行加权。SPAM可以方便地嵌入到各种主流卷积神经网络架构中,只需增加微量参数和计算量,就可以显著提高网络性能。为了证明SPAM的有效性,在ImageNet-1K、CIFAR-100和Food-101图像分类数据集上进行了大量实验,并使用Grad-CAM可视化了网络的关注区域。实验结果表明,在ImageNet-1K、CIFAR-100和Food-101数据集上,SPAM分别将基线网络的准确率最多提高了约1.08%、2.46%和1.09%。研究结果表明,嵌入SPAM的网络的性能都有较大提升;且相较于其他常用的轻量级注意力机制,SPAM的效果始终更好;SPAM使网络更关注目标对象所在区域,确切提高了网络的表达能力。
- 单位