基于HRED模型的中文多轮对话任务方法研究

王孟宇; 俞鼎耀; 严睿<sup>*</sup>; 胡文鹏; 赵东岩

摘要

多轮对话任务是自然语言处理中最具有实用价值的技术之一,该任务要求系统在产生通顺回答语句的同时能够照顾到上下文信息。近年来,出现了一大批以HRED(hierarchical recurrent encoder-decoder)模型为基础的多轮对话模型,其运用多层级的循环神经网络来编码上下文信息,并在Movie-DiC等英文对话数据集上取得了不错的结果。在2018年京东举办的中文多轮对话大赛中,京东向参赛选手公布了一批高质量的真实客服对话语料。该文在此数据上进行实验,针对HRED模型的缺点以及在中文语料下的表现进行改进,提出基于注意力和跨步融合机制与HRED模型结合的方案,实验结果表明,该方案取得了较大的性能提升。

单位
北京大学王选计算机研究所

收藏分享被引浏览

更新时间：2024-04-13 08:47

基于HRED模型的中文多轮对话任务方法研究

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友