摘要
在大数据背景下,相似最近邻查询面临维度灾难、存储代价大、查询效率低三大难题。经典的哈希方法,如局部敏感哈希(Locality-Sensitive Hashing,LSH),因其数据独立的性质在现实任务中效果一般。基于机器学习模型的哈希方法较好的弥补了这一缺点,成为了目前哈希领域新的研究热点。本文主要从基于无监督模型和基于监督模型的两大类哈希方法进行介绍。无监督哈希方法介绍了K均值聚类哈希、自组织映射哈希、无监督随机森林哈希;监督型哈希方法介绍了神经网络哈希、CNN哈希、隐因子模型哈希。最后对以上哈希方法进行了归纳总结。
- 单位