摘要

本发明公开了一种用户个性感知的任务导向型对话策略学习方法,包括以下步骤:S1、收集人机对话数据,数据清洗;S2、对清洗过的数据进行预处理;S3、构建个性感知对话策略模型,包括个性动作模块、个性感知模块以及加权融合模块;S4、个性感知模块引入用户个性特征以及对话上下文特征,评估用户个性动作价值;S5、个性动作模块将对话状态和用户属性向量作为输入,通过前馈神经网络计算得到系统动作价值;S6、加权融合模块计算系统动作的综合价值,并选择最高得分的动作作为系统回复动作;S7、执行预测的系统对话动作,优化个性感知对话策略模型参数。本发明克服现有策略方法缺少对用户个性建模的问题,使策略模型生成的回复动作更具针对性。