摘要

针对客服机器人答非所问的情况,提出一种结合循环神经网络学习算法LSTM(Long Short-Term Memory)、词频-逆文档频率(Term Frequency-Inverse Document Frequency, TF-IDF)算法及余弦相似度算法的客服机器人设计方法。LSTM算法利用长短记忆法更有利于联系上下文进行分词,分词准确率更高。TF-IDF算法可以将非结构化的客户提问和问题库问题用结构化的向量表示出来。通过余弦相似度算法对客户提问标签和问题库标签进行匹配,可以将最优答复提交给客户。试验结果显示,客户提问与问题A的余弦相似度值只有0.52左右,而与问题B的余弦相似度值达0.81,因此可以很好地实现答复推荐。

  • 单位
    南京科技职业学院