摘要
基于卷积神经网络的自监督表示学习因可处理无标签数据而在近来获得广泛应用,然而由于其较慢的收敛速度和较差的细节提取能力导致计算量大和性能较低。为解决上述问题,提出一种基于乐高采样策略的有效且高效的自监督表示学习方法。该方法首先引入乐高采样策略,通过在原始图像中采样较小补丁以增加样本数量,同时使用较小补丁拼接的图像以维持较少的计算量,其次引入了一个局部细节对比分支来平衡局部细节特征和全局语义特征之间的关系,最后使用多种损失函数共同优化模型。在CIFAR和3个细粒度分类数据集上对比验证了方法的有效性。实验结果表明,本方法较MoCo等方法能够获取更为全面的全局信息和细节信息,并且在下游线性分类、目标检测等任务中获得更好的分类准确率和检测平均精度,且具有较好的视觉效果。
- 单位