摘要
SSD属于经典的单阶段目标检测算法,它通过在不同卷积层上生成六个尺度的特征图来进行预测,但由于其存在浅层特征图的非线性程度不够、缺乏语义信息等问题,同时小目标所含像素少,在经过多次卷积操作后信息丢失严重,从而导致小目标的检测准确率远低于大中尺度的目标。为了解决上述问题,提出了多尺度特征与混合注意力机制融合的策略,即在替换原骨干网络的基础上构建自下而上的下采样路径和自上而下的上采样路径。具体来说,下采样路径使用自注意力机制自适应地增强浅层空间特征和深层语义特征。在上采样路径中,通过融合三个尺度的特征图的局部信息和全局信息,增强深层特征的语义信息,并且引入空间注意力机制和坐标注意力机制丰富待融合特征图的语义信息和位置信息,同时使用自注意力增强模块进一步增强融合特征的表达能力。实验证明,本文提出的改进算法与SSD算法相比,当输入图像大小为512×512时,在PASCAL VOC和HRRSD数据集上达到了84.6%和89.6%的平均精度,分别提高了6.1%和8.8%,对于小尺寸目标的检测效果显著。
- 单位