实体统一对于提高数据的简洁性和准确性具有重要意义。在Web数据集成领域,实体统一是被广泛关注的重点研究方向。文章基于朴素的成对匹配实体统一算法,提出一种新的基于特征的增量式实体统一方法,通过对实体特征的有效区分并定义新的数据结构,提升了算法的准确率,降低了算法时间复杂度,并应用于DBLP论文数据库,结果证明该方法可以有效提升Web数据集成的数据质量。