摘要

在细粒度视觉识别领域,由于高度近似的类别之间差异细微,因此图像细微特征的精确提取对识别的准确率有着至关重要的影响。现有的热点研究算法中使用注意力机制提取类别特征已经成为一种趋势,然而却忽略了其他不明显但可区分的细微部分特征,并且孤立了对象不同判别性区域之间的特征关系。针对该问题,提出了基于中层细微特征提取与多尺度特征融合的图像细粒度识别算法。首先,利用通道与位置信息融合中层特征权重方差度量提取图像显著特征,而后通过通道平均池获得掩码矩阵抑制显著特征,增强其他判别性区域细微特征的提取;其次通过通道权重信息与像素互补信息获得通道与像素多尺度融合特征,增强不同判别性区域特征之间的多样性与丰富性。实验结果表明,该算法在数据集CUB-200-2011上达到89.52%的top1准确率、98.46%的top5准确率;在数据集Stanford Cars上达到94.64%的top1准确率、98.62%的top5准确率;在数据集FGVC-Aircraft上达到93.20%的top1准确率、97.98%的top5准确率。与循环协同注意力特征学习网络(PCA-Net)算法相比,top1的准确率分别提升了1.22个百分点、0.34个百分点和0.80个百分点;top5的准确率分别提升了1.03个百分点、0.88个百分点和1.12个百分点。