摘要

本发明公开了一种面向任务型对话系统的对话策略方法,应用在基于知识图谱的音乐智能搜索场景中,包括以下步骤:S1、针对特定领域构建马尔科夫决策模型;S2、利用贝尔曼方程计算状态值函数矩阵;S3、结合当前时刻的对话状态,匹配知识图谱和搜索知识库,得到满足用户目标的音乐结果;S4、对搜索结果进行属性信息熵计算;S5、对计算出来的属性信息熵进行分析;S6、通过状态转移矩阵计算出下一轮动作。本发明克服任务型对话系统中完全冷启动的困难,通过构建强化学习模型计算状态值函数矩阵,结合状态值函数矩阵的结果与该状态的属性信息熵,得到下一轮的动作,用更少的对话轮次完成知识搜索任务,具有很好的可用性。