摘要
现有的情感对话生成方法通常以基于序列到序列(Seq2Seq)的对话生成模型为基础,在编码或解码进行情感方面的改进,该类方法虽然能够实现一定的情感回复生成能力,但容易出现低质量的通用回复问题。为解决以上问题,实现情感可控且高质量的回复生成,提出了一种结合微调与重排序的情感可控对话生成方法,称为情感生成式预训练Transformer(EmoGPT)。在模型训练阶段,提出使用带有情感类别标签的对话语料微调GPT-2模型的方法,使其学习语句中语义和情感的依赖关系;在回复生成阶段,提出情感重排序策略对生成的多句回复进行情感打分并排序,以提高回复情感可控性。在使用带有情感标签的对话数据集的情感回复生成实验结果显示,带有情感重排序策略的EmoGPT在生成回复的内容相关性和情感一致性方面取得了领先于对比模型的性能,从而验证了文中方法的情感可控且高质量的回复生成能力。
- 单位