摘要

图像分类是计算机视觉领域的一个重要研究分支,普通图像分类关注主类对象差异性的判别,而细粒度图像分类则重点研究主类下不同子类的区分。考虑到较小的子类间差异(只在某个局部上有细微差异)和由于拍摄角度、背景、姿态等因素导致的较大的子类内差异,细粒度图像识别成为一项颇具挑战的任务。为了缓解细粒度图像数据集难以获取和扩充的问题,本文提出了一种基于迁移学习和孪生网络实现的无监督细粒度图像分类模型。该模型采用两阶段训练策略,第一阶段采用有监督方式预训练基础网络,使模型快速学习到细粒度图像的通用特征;第二阶段通过搜索引擎扩充数据集,设计孪生网络并采用无监督方式微调模型以实现知识迁移。实验表明,孪生网络模型在Stanford Car和Aircraft数据集上能够获得较好的性能表现。

  • 单位
    上海通用汽车有限公司