摘要
智能客服利用人工智能技术准确回答用户的咨询问题,良好的句子相似度算法可以提高智能客服中问答的准确度.本文针对金融证券领域客服,提出了基于多特征融合的句子相似度算法模型,提高了客服的智能性.通过矩阵拼接的方式,融合用户提问语句和知识库语句的词形特征和语义特征,其中词形特征考虑N-gram相似度、编辑距离、Jaccard相似度三种词形信息,并针对语义特征提取,提出了基于多头注意力机制(multi-head attention)的神经网络模型LBMA.利用上述融合的特征,运用机器学习分类器判断两个语句是否相似,并将分类器分类结果作为多特征融合模型的计算结果.在尽量不改变语义信息的前提下,通过数据增强(Data Augmentation, DA)技术扩充数据集,提升了模型泛化能力.实验结果表明,与已有方法相比,该模型在智能客服数据集上能够有效提升相似度计算的准确性,准确率达到94.69%.
- 单位