基于注意力数据增广的细粒度图像分类方法

作者:徐智; 宁文昌; 赵龙阳*; 孟瑞敏
来源:桂林电子科技大学学报, 2021, 41(06): 496-503.
DOI:10.16725/j.cnki.cn45-1351/tn.2021.06.006

摘要

细粒度图像分类是一个具有挑战性的问题,现有的细粒度图像分类模型一般都具有复杂精细的结构,但多数模型实现起来较困难,且分类精度不高。为了提高分类精度,同时降低分类模型的复杂度,提出了一种基于注意力数据增广的细粒度图像分类方法。该方法通过注意力机制实现弱监督方式的判别性区域定位,并基于判别性区域实现数据增广。其中数据增广包括2种策略:判别性区域裁剪和非判别性区域擦除。通过合理地设计这2种策略,可使图像分类模型更充分地学习到判别性区域的特征,提高模型的细粒度图像分类效果。该方法在细粒度图像数据集Stanford Cars和FGVC Aircraft上分别取得了95.0%和93.4%的准确率,已经达到了当前先进的水平。另外,该方法没有引入复杂的模块,因此比多数细粒度图像分类方法更容易实现。