摘要
基于共词分析的聚类算法存在的不足:(1)聚类过程需要事先确定聚类数目;(2)关键词只能被划归一个聚类,文章采用复杂网络社区检测算法改进共词分析方法,提出改进的社区检测算法CW_UEOC(Co-occurrence weighting unfold and extract overlapping communities),并对来源于web of science的文献题录数据(以情报学和图书馆学(Information Science&Library Science)为例)构建共词网络进行聚类实验检验。研究结果表明:所提出的CW_UEOC社区检测算法对关键词的聚类结果有好的改进,能将多领域的相同关键词划分为不同研究主题,且CW_UEOC社区检测算法使用连通度(conductance)作为截断准则,为聚类数目提供客观判断依据。
- 单位