一种基于语义相似度的信息资源语义聚类算法

作者:熊芳; 黄宏斌; 黄玉成; 冯嵩; 胡建中
来源:计算机工程与科学, 2012, 34(11): 175-179.
DOI:10.3969/j.issn.1007-130X.2012.11.031

摘要

根据各分布信息源信息单元实体类的语义相似度,对于信息单元实体类进行聚类,是半自动地进行本体映射、构建分布异构信息资源全局视图的重要步骤。本文面向分布信息资源统一信息视图构建需求,利用基于本体的元数据模型及语义相似度,在其基础上定义了语义聚类特征,基于语义聚类特征设计了一种基于语义特征树的混合层次聚类算法SCFBHCA。从理论和实验两个角度对SCFBHCA算法进行了分析,对比HCA和HCP,该算法具有增量式和扩展性且效率更高。

全文