摘要

基于SaaS的在线服务数量日益宠大,使得如何有效的查找特定的服务成为突出问题.目前普遍采用用户自定义的服务标签来标识服务,并通过标签来搜索服务,但这些标签存在随意性,容易产生歧义.有鉴于此,本文提出一种从软件说明文档中挖掘用以标注服务标签的方法,为了验证该方法,本文收集了多特软件平台上的软件说明文档,通过文本挖掘技术从中提取特征词汇,并对特征词汇进行相似度计算,利用特征词汇的相似度来计算软件说明文档之间的相似度,并以此来构建软件网络,其中节点为软件,边为软件间的相似关系,边上权值为相关说明文档之间的相似程度,再通过复杂网络社区发现算法对软件网络进行自动聚类,最后将聚类后的软件说明文档中的常用特...