RM树:一种支持字符串相似性操作的索引

王金宝; 高宏; 李建中; 杨东华

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

RM树:一种支持字符串相似性操作的索引

作者：王金宝; 高宏; 李建中; 杨东华

来源：计算机学报, 2011, (11): 2142-2154.

摘要

字符串相似性操作在很多领域中被广泛应用,如数据清洁、信息集成等.现有研究工作主要为基于q-Gram和倒排索引的内存方法,在处理大量数据时具有以下缺点:内存消耗大、更新效率低、支持操作类型有限.现有的外存索引Bed树无法将相似的字符串聚类,在查询处理过程中导致了较大的I/O代价.该文设计了支持多种字符串相似性操作的RM树索引,消除了现有内存方法的缺点,并通过字符串聚类的方法提高了相似性操作的效率.该文通过大量实验结果证明了RM树的有效性.

单位
哈尔滨工业大学

收藏分享被引浏览

更新时间：2019-10-03 17:54

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号