基于聚类汇总的记录匹配算法

作者:王天江; 刘芳; 卢正鼎
来源:计算机工程与科学, 2004, 26(09): 62-63+101.
DOI:10.3969/j.issn.1007-130X.2004.09.019

摘要

记录匹配算法在异构数据的集成和数据开采等领域应用广泛 ,其主要任务是找出来自不同数据源中代表同一对象实体的记录 ,这些记录具备相似的属性和属性值。为避免组合爆炸问题 ,现有的记录匹配算法不再对数据库中的记录数两两匹配 ,而是结合排序策略和静态聚类匹配方法实现 ,但这种静态方法不适应数据的动态变化。因此 ,本文提出基于聚类汇总的记录匹配算法 ,该算法可以解决静态方法导致的匹配记录丢失问题 ,同时能够减少计算量 ,提高匹配记录搜索效率。

全文