摘要

细粒度的图像分类的重要任务就是需要从输入的图像中提取出具有显著的判别性区域特征。之前有许多研究人员和学者使用手动标注图像关键部位的方法,构建获取图像显著区域特征的模型,这就是强监督学习。与强监督网络需要额外的标注不同,弱监督网络仅仅用到图像的类别标签。但弱监督的方式引入了很多图像背景信息及噪声干扰,本文提出了一种基于注意力机制引导下的图像增强方法,端到端实现细粒度图像分类。本文使用深度卷积网络作为骨干网生成图像的特征图,然后通过注意力机制生成相应的关注图,并使用关注图来指导图像增强过程。我们对三个常用的细粒度图像分类数据集进行了实验,并在CUB,FGVC-Aircraft和Stanford-Cars中取得了比同期更高的分类准确度。