摘要
为解决以往突发事件案例检索中忽视文本属性重要性的问题,提高案例检索的准确度,将词语语义相似度计算应用到文本属性中。因案例文本特别是结构化突发事件案例的文本属性多为短文本,常规的文本分析技术难以获取足够的语义信息,故着重从3个方面研究了短文本的语义:上下文语义、单个汉字的语义和概念的层次关系,提出了基于WNCH的词语语义相似度计算方法,该方法在传统词嵌入模型中增加了Ngram和汉字的语义信息,并与HowNet相融合。在此基础上,给出了基于属性相似度的突发事件案例检索流程,将WNCH方法应用到文本属性相似度的计算。实验结果表明,文本属性的引入使得案例检索匹配更多的关键信息,从而使案例检索更加准确。
- 单位