摘要

传统方法在图像检索和位置识别中存在局限性,而深度学习模型通过学习大规模图像数据中的特征和模式来实现端到端的检索和识别。文章介绍了基于深度学习的图像检索和位置识别方法,先使用Siamese网络架构和视觉几何群(Visual Geometry Group,VGG)网络进行图像特征提取,再利用可嵌入网络的局部聚集描述子向量(Net Vector of Locally Aggregated Descriptors,NetVLAD)方法进行特征聚合,具体步骤包括局部特征提取和全局特征聚合。实验结果表明,基于深度学习的方法具有较好的图像检索性能,在多种复杂条件下的表现优于传统的全局特征方法。