摘要

本发明公开了一种基于词组多样性的对话生成方法,构造对话生成模型,包括句子编码器、上下文编码器、转化层、条件变分自编码器、解码器以及词袋层,包括步骤:将对话上下文编码为一个上下文向量;将上下文向量映射为符合解码器输入大小的隐含状态,并将得到的隐含状态作为解码器的初始隐含状态;获取随机潜在变量;将得到的随机潜在变量、上下文向量、前一个词的词向量以及前一个时间步的隐含状态输入解码器的循环神经网络单元,得到循环神经网络单元输出的当前时间步的隐含状态;将解码器输出的当前时间步的隐含状态输入到词分类器,得到词分类器输出的一个词表大小的概率分布向量。本发明能够生成较为流畅且具词组层级多样性的对话回复。