摘要

本发明公开了基于主题聚类的自适应对话生成系统,包括对话数据模块、向量化模块、聚类模块、Seq2Seq模块;对话数据模块,用于在训练之前构建对话数据集;向量化模块,用于在聚类之前将对话数据集向量化并作为聚类模型的输入,成为聚类的依据;聚类模块,用于将向量化后的对话数据集聚类为多个簇;Seq2Seq模块,用于构建Seq2Seq模型,对聚类模块得到的簇中的对话数据集生成对应的回复。本发明可以将对话数据按照主题进行聚类,针对不同类别的对话数据使用特定的Seq2Seq模型进行训练。在经典的Seq2Seq模型下,往往会产生无意义的回复。而通过本发明提出的模型可以让对话系统生成更符合主题、更有意义的回复。这样的回复能让用户更愿意去和对话系统进行交流,提升用户体验度。