SIFT特征被广泛运用于图像检索,由于其高维度的特性,对于大量图像检索而言,很难在保证准确度的前提下达到理想的速度。本文提出一种基于分布式并行计算的SIFT算法,在hadoop集群下利用K-Means将特征聚类,将聚类中心作为Bag-of-Words模型的视觉词袋,得到所有图像直方图,最终计算这些图像与检索图像特征向量之间的相似度,返回相似度最大的一些图像。