摘要
随着SOA技术的发展,Web服务服务的数量增长迅速。正确高效地对Web服务进行聚类或分类,能够有效地提高服务发现质量以及促进服务组合效率。然而,现有的Web服务建模方法(如LDA主题模型)难以从稀疏的Web服务数据中获得精确有效的信息用于Web服务聚类。针对这个问题,本文提出了一种融合多维信息的Web服务表征方法,称为MISR。首先,将高斯混合模型和Word2Vec算法相结合生成包含Web服务功能主题信息和语义信息的词向量表征。然后,抽取出Web服务中包含的标签-词汇信息、流行度以及Web服务共现信息,结合前一步生成的向量生成包含多维信息的Web服务表征向量。最后,在Web服务聚类和Web服务分类两个任务上对MISR方法的有效性进行验证。在真实数据集上进行Web API服务聚类实验,实验结果表明,相比于LDA、Word2Vec、Doc2Vec、WT-LDA、HDP-SOM、GWSC,本文提出的方法在Micro-F1值上有着38.8%、54.5%、15.3%、33.3%、44.7%、9.7%的提升。
- 单位