一种基于主题过滤和语义匹配的服务发现方法

作者:周澳回; 翁知远; 周思源; 黄乔*; 汪烨; 张华
来源:郑州大学学报(工学版), 2022, 43(06): 36-56.
DOI:10.13705/j.issn.1671-6833.2022.06.003

摘要

在互联网现有的大量可用的服务中,如何高效的为特定的业务目标匹配合适的服务是目前研究的一大难题。针对这一问题,提出一种基于主题过滤和语义匹配的可用于海量服务发现的方法。首先,使用Word2Vec对主题描述文本和业务目标描述文本进行相似度比较,获取业务目标主题。其次,使用TextRank对服务描述文本提取服务关键句,通过提取到的业务目标主题对服务关键句进行过滤,缩小比较范围。再次,对相应的业务目标与服务描述文本进行词向量提取,使用带注意力机制BiLSTM模型计算两者相似度并返回与业务目标描述文本最相似的前N个服务列表给业务开发人员进行选择,并对从Programmable Web上爬取的数据进行标注,以此建立实验所需的业务目标-服务句子数据集,评估本文方法的有效性。最后,与TextCNN等模型进行对比,结果表明:本文方法的MAP比不带注意力机制的BiLSTM模型、TextCNN模型、Word2VecSD模型分别提高了1.41百分点、4.61百分点和4.95百分点,并且在今后的工作中有进一步改进的潜力。

全文