摘要
人机会话在自然语言处理乃至人工智能领域中起着重要标志性作用,可根据使用目的划分为问答系统、任务型会话、聊天系统等,其中聊天型会话通常具有更高的拟人需求。该文在基于长短期记忆网络的序列变换模型基础上,通过引入话题网络显式抽取会话中的场景与话题信息,并将这种不随语序变化的高层抽象信息扩展到会话模型结构中,与注意力机制共同指导解码预测过程。由于难以事先获取话题信息,话题网络被建模为非监督式学习模型,因此训练过程需分三步进行。实验结果表明,在恰当的训练方法和结构参数下,该模型能够使聊天会话的质量得到明显提升。
- 单位