基于分层索引的高维数据对象检索

作者:黄颖; 张豹; 陈伟荣; 戴鹏
来源:指挥信息系统与技术, 2019, 10(06): 81-85.
DOI:10.15908/j.cnki.cist.2019.06.015

摘要

随着海量信息检索技术的发展,对文本、图片和视频等高维数据对象的相似性检索要求不断提高。局部敏感哈希(LSH)是解决高维数据近邻检索的主要方法之一,但存在索引存储代价高及查询效率低等问题。提出了一种基于二级混合索引模型构造方法,先利用溢出树(Spill tree)对数据集进行划分,再对每个部分构建基于LSH的哈希表,形成混合索引,支撑高维数据检索。试验表明,该方法缩小了高维数据对象的索引存储空间,提高了查询效率和查询质量。

  • 单位
    东南大学; 中国电子科技集团公司第二十八研究所