词语语义相似度在突发事件案例检索中的应用

作者:邱俊安; 邱奇志; 周三三; 陈先桥; 贺宜
来源:武汉理工大学学报(信息与管理工程版), 2020, 42(03): 272-278.

摘要

为解决以往突发事件案例检索中忽视文本属性重要性的问题,提高案例检索的准确度,将词语语义相似度计算应用到文本属性中。因案例文本特别是结构化突发事件案例的文本属性多为短文本,常规的文本分析技术难以获取足够的语义信息,故着重从3个方面研究了短文本的语义:上下文语义、单个汉字的语义和概念的层次关系,提出了基于WNCH的词语语义相似度计算方法,该方法在传统词嵌入模型中增加了Ngram和汉字的语义信息,并与HowNet相融合。在此基础上,给出了基于属性相似度的突发事件案例检索流程,将WNCH方法应用到文本属性相似度的计算。实验结果表明,文本属性的引入使得案例检索匹配更多的关键信息,从而使案例检索更加准确。