摘要
如何有效地发现合适的Web服务是面向服务计算领域需要解决的核心问题之一.随着Internet上Web服务数量的不断增加,服务的自动发现面临着极大的挑战.将功能相似的Web服务进行聚类是一种有效的服务发现与服务管理方法.目前国内外主流的方法为挖掘Web服务的隐含功能语义信息,如使用LDA主题模型训练提取Web服务功能描述文档的主题信息,然后基于某种聚类算法如K-means将隐含主题分布相似的Web服务聚为一类.然而,Web服务的功能描述文档通常短小,目前大部分主题模型无法对短文本进行良好地建模,从而影响了Web服务聚类的效果.针对该问题,文中提出了一种考虑多重Web服务关系的概率主题模型MR-LDA,其可对Web服务之间相互组合的关系以及Web服务之间共享标签的关系进行建模,能有效提高Web服务聚类的精度.同时,基于该MR-LDA主题模型进一步提出了一种有效的Web服务聚类算法MR-LDA+,该算法首先利用上述多重Web服务关系信息对Web服务隐含主题分布概率矩阵进行修正,然后根据这些隐含主题对Web服务进行聚类.基于ProgrammableWeb收集的真实数据实验表明,文中所提出的方法明显优于其它Web服务聚类算法.
- 单位