摘要

各类注意力机制模块被表明嵌入深度学习网络中能更充分地提取特征信息。这些机制在通道或空间特征提取方面、两者交互方面仍有优化的空间。本文提出了一种复合型三分支注意力机制(Triplet Coordinate Attention,TCA),该机制基于三分支注意力机制(Triplet Attention,简称TA),引入坐标注意力机制(Coordinate Attention,简称CA)更好地提取空间交互注意力和通道空间交互注意力。TCA机制的参数量和运算量均不大,能够嵌入各种主干网络中。本文在图像分类数据集miniImageNet、目标检测数据集VOC2007和2012上做了大量对比实验,结果表明,网络模型嵌入TCA能进一步提升精度。特别是,较CA和TA在MobileNetV2图像分类任务中Top-1准确率分别提高了1.01%,1.62%;在MobileNetV3+SSDLite目标检测任务上AP50精度分别提高0.5%、2.0%。