摘要

SSD(SingleShotMultiboxDetector)是一种基于卷积神经网络的单阶检测算法,相比双阶检测算法,它在保证一定精度的同时大大提高了检测速度,但仍难以满足很多实际应用,尤其是在小目标检测任务中,检测精度更是难以满足需求。针对该不足,文中提出了一种基于改进残差结构与卷积注意力模块的特征提取网络Res-AmCNN(ResidualwithAttentionModuleConvolutionalNeuralNetworks), 大幅提高了网络的特征提取能力,并在原始SSD金字塔结构中引入上采样加法融合 (AdditiveFusionwithUpsample,AFU)来进行特征融合,增强了浅层特征的表征能力。在PASCALVOC数据集上的实验结果表明,相比原始SSD网络和主流的检测网络,Res-Am& AFUSSD(SSDwithRes-AmCNNandAFU)网络在VOC测试集上的平均精度均值 (meanAveragePrecision,mAP)达到69.1%,在精度上领先单阶网络,接近双阶网络,在速度上大幅领先双阶网络。在小目标测试集上的实验结果表明,Res-Am& AFUSSD网络的mAP为67.2%,比原始SSD提高了9.4%,且该方法具有更加灵活、无需预训练等优点。