摘要
目前分词工具在金融领域智能客服中无法对金融相关词汇进行有效切分,且基于单词的模型更容易受到数据稀疏性和词汇表外单词的影响。针对该问题,提出一种基于字向量和增强表示BiLSTM的句子相似度计算模型—EBiLSTM。该模型首先通过双向长短时记忆网络BiLSTM提取由字嵌入组成的句子的字特征及其上下文表示,然后计算句子对中一个句子与另一个句子的软对齐表示,在此基础上通过句子表示与其对齐表示间的交互来增强最终的句子表示。所提模型可以有效学习到句子对的语义关系,加入增强表示层后通过两个句子的交互可以更好地捕捉两个句子间的语义差异。实验表明,所提模型在真实数据集上,精确率、召回率和F1值均优于基于词向量的CNN和BiLSTM方法,也优于基于字向量的CNN和BiLSTM方法。
- 单位